功能说明
文章内容采集工具实现了无需编写任何采集规则,只要输入关键词就可以采集海量网络文章,支持各大主流网络平台+大部分自媒体平台的文章采集,支持多线程采集,采集效率高。通过采集任务,实现文章内容的采集,采集完毕后,可以在采集数据管理栏目对采集的数据进行编辑删除导出等操作
功能主界面
获取采集数据
按上图,点击”获取采集数据“按钮,可以获取已经采集的数据。获取的同时,可以选择具体的采集任务,文章发布时间,以及文章包含的关键词来过滤数据。按上图,点击左侧具体的文章标题,右侧的编辑框会显示某个文章的具体内容,在编辑框对文章内容可进行修改,然后点下面的”保存文章内容“可修改保存的文章内容。数据导出
本功能实现对数据列表显示的文章标题内容等导出到本地文件。- 合并到一个txt
默认此项选中,点击导出后将列表里的数据(文章标题和内容)合并导出到一个txt文件,”只导出文章标题“打勾,将只合并文章标题到一个txt文件。”只导出文章内容“打勾,将只合并文章内容到一个txt文件,如果两个都不打勾,则默认导出文章标题和内容到一个txt文件。 - 每条数据导出一个文件,文章标题为txt标题,文章内容为txt内容
选中此项,点击导出按钮,导出完成后列表里的每个数据都将导出生成一个txt文件,其中文章标题为txt标题,文章内容为txt内容。 - 去除文章中的html代码(只保留文字和段落)
本项打勾,导出的文章内容将不含html代码(默认有),导出到文本文件的文章内容即为可读内容,没有附带的任何html代码。 - 删除采集任务
选定一个采集任务,点此删除该任务。 - 刷新任务列表
点击此按钮刷新采集任务列表。