功能说明
本功能支持针对全球50多个国家地区不同google搜索URL&Title功能,只要输入批量关键词就可以采集大量的google收录的URL和对应网页Title。
功能主界面
采集设置
-
查询范围:
默认是查询top50,也就是查询搜索引擎前5页的结果获取网址和标题,可以在下拉框中选择其他结果,百度pc最多支持top1000(前76页结果),其他搜索引擎最多支持top100 。 - 只采集首页URL
"只采集独立首页URL"此项打勾,将保证采集到的URL全部是独立首页网址,也就是说只保留www.abc.com、abc.com等这样的网址,www.abc.com/abc、www.abc.com/aa.html等这种内页网址都会被排除。前面勾选后,"自动提取首页URL"也将变成可选,如果此项打勾,工具会对所有采集到的URL自动提取其首页网址并保留,比如采集到www.abc.com/abc,工具将自动提取www.abc.com,这个选项勾选会使工具采集到的独立首页网址增加很多。 - 启用自动换IP
针对google搜索引擎采集的过程中会封IP,导致采集不到URL。需要勾选此项配置代理IP或者拨号换IP服务器,具体设置请参考"自动换IP设置",注意:google的所有功能都需要选用国外代理IP才能访问。
数据导出
等所有数据采集完毕后,点图示的"导出数据"按钮,可以导出采集的数据到本地文件。"导出数据"后面的下拉框,可选择导出数据的类型,默认"导出所有数据" ,将导出数据列表中的所有数据,包括网址URL、标题Ttitle、关键词、搜索引擎等,导出格式为csv。选择"只导出网址"将只导出列表中的网址URL,选择"只导出Title"将只导出列表中的标题Title。