爬虫 - 后羿采集器
快速数据采集 快速数据收集
1.软件爬虫 获取数据 解析数据 保存数据
2.程序爬虫 获取数据(requests selenium) 解析数据(正则 css xpath) 保存数据(csv excel 数据库)
收集速度:程序爬虫>软件爬虫
思路:
1.确定目标数据
2.找网站
3.构建爬虫任务 复制目标网站地址
新建分组:test
![请添加图片描述](https://img-blog.csdnimg.cn/63a6e11ca214438aa8835d0b6f1f46b8.png)
创建新的任务
![请添加图片描述](https://img-blog.csdnimg.cn/4bfe6b1a6d9d438d92207cc2a0f101aa.jpeg)
创建之后软件会自动进行数据的采集,采集加载完成之后再选择需要的数据。
![请添加图片描述](https://img-blog.csdnimg.cn/d779b5c2b891426c99df83b4a955b90d.jpeg)
![请添加图片描述](https://img-blog.csdnimg.cn/7eab8286f77b4d7997b55040528d5bfe.png)
如果要爬详情页数据:点击深入采集(深入采集的第一个链接必须要保留,软件会自动进入第一个链接字段)