功能说明

本功能通过输入关键词,来访问搜索引擎的结果,获取大量搜索引擎收录的网址URL和标题Title。工具支持海量关键词同时分析多个搜索引擎获取网址和Title,支持多线程分析,采集效率非常高。

功能主界面

采集设置

  • 显示http(https)
    此项打勾,采集到的网址url,将保留默认的http://或https://前缀。
  • 查询范围:
    默认是查询top50,也就是查询搜索引擎前5页的结果获取网址和标题,可以在下拉框中选择其他结果,百度pc最多支持top1000(前76页结果),其他搜索引擎最多支持top100 。
  • 采集独立首页URL

    "只采集独立首页URL"此项打勾,将保证采集到的URL全部是独立首页网址,也就是说只保留www.abc.com、abc.com等这样的网址,www.abc.com/abc、www.abc.com/aa.html等这种内页网址都会被排除。前面勾选后,“自动提取URL的首页”也将变成可选,如果此项打勾,工具会对所有采集到的URL自动提取其首页网址并保留,比如采集到www.abc.com/abc,工具将自动提取www.abc.com,这个选项勾选会使工具采集到的独立首页网址增加很多。
  • 启用自动换IP
    针对百度移动、Sogou移动和PC、360等搜索引擎挖掘的过程中会封IP,导致采集不到URL。需要勾选此项配置代理IP或者拨号换IP服务器,具体设置请参考"自动换IP设置",如果觉得换IP比较麻烦,可以使用本功能的网络版 在线关键词深度挖掘,可以不用考虑封IP的情况。
  • URL&Title预过滤

    本功能可以输入采集过程中采集到的URL必须包含的网址或者不得包含的网址,设置后采集过程中会实时显示过滤后获得的网址,Title预过滤同理。记住设置完成后一定要点保存。

数据保存


”启用实时保存“如果此项打勾,工具在采集过程中,每采集到一定数量的URL网址(按自己设置)就会自动保存一个文件,比如设置每10000个自动保存,采集到前10000个网址会自动保存一个文件,10000-20000个网址也会自动保存一个文件,以此类推...。此功能自动保存为txt格式,保存文件名工具自动生成,点击"设置包存路径"可以自己设置文件保存的具体路径,不设置的话,默认保存在工具所在文件夹目录。

数据导出


等所有数据采集完毕后,点图示的”导出数据“按钮,可以导出采集的数据到本地文件。”导出数据“后面的下拉框,可选择导出数据的类型,默认”导出所有数据“ ,将导出数据列表中的所有数据,包括网址URL、标题Ttitle、关键词、搜索引擎等,导出格式为csv。选择”只导出网址“将只导出列表中的网址URL,选择”只导出Title“将只导出列表中的标题Title。