简数采集器是新一代的网页数据采集器,集成了智能识别引擎:
采集数据时,只需输入一个URL(网址),平台会使用智能算法进行数据提取,包括列表页、翻页和网页详情(如标题,正文,日期,作者,标签等),全自动化比传统采集器配置要简单和高效很多倍!而且不需要懂代码!
只需以下简单三步就可以完成一个采集规则的配置:
1. 输入采集网址
进入简数采集器,点击创建采集任务,输入要采集的网址(URL),接着点击下一步即可。
2. 智能配置采集规则
接着系统会智能识别并配置对应的列表页、文章详情页采集规则,只需点击下一步按钮即可。
智能配置的列表页规则:
智能配置的文章详情页规则:
3. 启动采集
采集规则配置完成后,就可以启动采集了,以下是完成采集的结果。
完成,配置采集规则和数据采集就这么简单!!!
不用手写规则,不用研究网页源代码,仅需输入一个URL就能完成采集规则配置,简单高效!