善肯网页TXT采集器是一款高效便捷的网文采集工具,具备下载、即时浏览和文字替换等功能。目前该软件仅支持获取免费章节目录,无法解析VIP章节目录。
即时浏览:在规则设定对话框中,您可以随意选择一篇文章,不填写任何规则,点击“即时浏览”功能,查看是否能获取网页源代码。若能成功获取,再根据实际情况编写规则;若无法获取,则无需进一步操作。
正则表达式应用:规则设定采用正则表达式与内容匹配的方式,具备一定基础者最佳。若基础薄弱也可参照提供的案例进行快速学习,无需深入学习正则表达式。
目录页与内容页分离:在规则设定过程中,目录页和内容页必须分别浏览,所以需要两个连接:一个用于目录页,一个用于内容页。
替换功能:支持通用性替换和定制替换。目前无需使用正则表达式,一般替换即可。务必键入值,包括空格字符。若需删除整行,请选中后按“Delete”键。内嵌\n可作为替换数据信息中的自动换行符。
编码选择:目前支持GBK和UTF-8两种编码,大部分网址均包含这两种编码中的一种。
分析:点击“分析详细地址”按钮,选择合适的分析选项。目前系统暂不支持删除操作,后续版本将增加相关功能。
下载方式:支持单章节目录下载和全篇下载。
章节数选择:若小说集没有章节数,可选择“添加章节数”选项。
在线观看:支持在线观看功能,但需连接网络。此功能仅为辅助阅读,非专业看小说软件。
下载进度与所需时间:下载过程中,系统将显示下载进度和总需时间,并支持线程同步。
.exe文件:软件实际上只需.exe文件即可运行,规则由用户自行添加。通用性替换规则存储在commonrule.xml文件中。网址规则存储在rule文件夹下,其中包含两个示例规则,供检测使用。其他网址规则可由用户自行添加或由开发者提供。
版本号:1.1:修复了第一章无法点击的bug。新增功能使获取网站链接的方法更加灵活。