后羿采集器
v4.0.1- 软件大小:81.36 MB
- 更新日期:2023-06-21 13:56
- 软件语言:简体中文
- 软件类别:网页辅助
- 软件授权:免费版
- 软件官网:待审核
- 适用平台:WinXP, Win7, Win8, Win10, WinAll
- 软件厂商:
软件介绍 人气软件 下载地址
软件功能
智能采集模式
该模式操作极其简单,只需要输入网址就能智能识别网页中的内容,无需配置任何采集规则就能够完成数据的采集。
支持可视化的网页点选操作
完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,根据软件给出的提示,用鼠标点击几下就能自动生成复杂的数据采集规则;
支持积木式采集组件拼接操作
通过将复杂的采集编码流程进行可视化封装,让开发采集规则就像搭积木一样简单,零基础也能很快上手。
支持单网址和多网址采集,支持从本地TXT文件中导入网址,也支持参数网址批量生成。
在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。
定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。
防屏蔽功能有较多的设置,用户可以通过多种方式来实现防屏蔽或者防反爬的目的。
自动导出
自动导出功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
下载图片功能可以实现在采集数据的同时,将网页上的图片下载到本地。
软件特色
操作简单,为广大无编程基础的用户提供了一个数据采集平台
安全无毒,此软件不会携带第三方恶意插件,木马病毒等危害电脑安全的信息
可选择抽取文本、属性、链接等
可自动采集数据
支持运行批量采集数据
可将采集到的的数据导出到电脑上保存
可一键发布信息到数据库、微信公众号等媒体平台
支持自定义采集流程
提供软件的使用教程
软件的使用完全免费,不会以任何理由收取用户费用
支持U盾偶任务同时进行、无数量限制
支持语段存储,切换终端同步更新
支持的导出格式有Excel、Txt、Csv、Html
支持的数据库类型有MySQL、PgSQl、SqlServer、MongDB
安装方法
1、找到下载完成的压缩包并解压、然后双击“houyicaiji-setup-3.3.5.exe”应用程序即可进入安装步骤。
2、阅读软件的许可协议,阅读完成后点击【我接受】即可进入下一步安装步骤。
3、如果您需要对文件的存储位置进行更改,请点击【浏览】并选择目标文件夹,选择完成后点击【安装】即可。
4、等待安装过程,大约五秒钟的时间即可安装完成。
5、安装完成后单击【完成】退出安装向导,默认运行此程序。
使用方法
如何正确地输入网址
1、在采集器的首页输入框中输入网址信息(智能输入一个网址),点击智能采集创建智能模式采集任务。
2、新建智能模式采集任务,打开网址编辑窗口:
智能模式支持手动输入多个网址、从本地文件中导入网址(目前只支持TXT格式文件,其余文件格式正在开发中)及批量生成网址。
在该窗口中输入/导入网址时,请保证格式符合如下要求:
1.的网页属于同一个网站;
2.网址请用回车键分割,保证每一行只有一个网址;
3.的网页属于同一种类型,例如都是单页类型、列表类型或列表详情页类型。
注意:不同网站的网页或者同一网站的不同类型的网页请建立不同的任务。
点击文件导入即可上传本地文件到软件中,选择完成后点击打开按钮即可。
点击批量生成、在输入网址框中输入出变化参数之外的网址,然后点击添加参数。
3、智能采集任务打开的界面中:
这里可以对网址进行编辑,超过200个请直接修改本地文件。
注意:如果是从本地文件中导入的网址,这里的修改不会影响本地文件。
点击如图所示位置修改网址信息
编辑之后的网址格式请符合上述第2条中的要求
输入网址的来源:
在智能模式下,后羿采集器可以进行自动翻页,所以输入的网址应该是已经完成了搜索操作,显示出最终需要被采集的内容的页面(或是多个需要被采集的连续页面中的第一个页面)。
例如:单网址采集,在爱奇艺中搜索“极限挑战”,打开对应的页面,复制网址粘贴到软件中即可。
4、选择页面类型及设置分页
在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也有可能出现偏差,此时您可以先手动自动识别一下,如果手动自动识别还不起效果,您可以手动点选列表,从而辅助软件识别出正确的结果。
5、预登录
在数据采集过程中,我们有时候会遇到需要登录才能查看内容的网页,这时我们需要用到预登录功能,登录成功之后就能进行正常的数据采集。
6、切换浏览器模式
在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
7、设置提取字段
智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。单击鼠标右键即可。
8、采集任务的设置
在启动采集任务之前,我们需要对采集任务进行设置,包括一些定时启动、防屏蔽、自动导出、和加速引擎等。
9、防屏蔽
防屏蔽功能有较多的设置,用户可以通过多种方式来实现防屏蔽或者防反爬的目的。
10、自动导出
自动导出功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
11、对上述操作完成后点击启动按钮或返回页面点击保存。
人气软件
-
网站万能信息采集器 8.68 MB
/简体中文 -
找货神器插件(chrome淘宝找货神器插件) 0.02 MB
/简体中文 -
Next FlipBook Maker Pro(HTML5翻页制作软件) 144 MB
/英文 -
自媒体全平台采集助手 2.85 MB
/简体中文 -
12306订票助手.NET版 3.31 MB
/简体中文 -
疯狂的美工阿里巴巴自由布局工具 4.66 MB
/简体中文 -
疯狂的美工在线自由布局工具 5.79 MB
/简体中文 -
万能弹窗广告工具 1.89 MB
/简体中文 -
酒店比价插件(chrome酒店价格比较插件) 0.79 MB
/简体中文 -
网页关键词监控大师 0.82 MB
/简体中文