案例:采集“人上人”官网首页数据列表
一. 网站内容
1. 网站截图说明
本教程通过采集“人上人”首页“最新资讯”栏目列表中的数据为例,如下图:
![5ab6e4e74f3fc5242d854de04b07c157.png](https://img-blog.csdnimg.cn/img_convert/5ab6e4e74f3fc5242d854de04b07c157.png)
【人上人官网-“联系我们”】
2. 采集结果截图
![208c4989fb63fba10a413677fc2a4b77.png](https://img-blog.csdnimg.cn/img_convert/208c4989fb63fba10a413677fc2a4b77.png)
【链接列表采集预览】
一. 操作方法
1. 新建任务
按图片数字所示,1-2-3完成新建任务的步骤
![153fcdaa2f22e3957458f7b620e1930d.png](https://img-blog.csdnimg.cn/img_convert/153fcdaa2f22e3957458f7b620e1930d.png)
【新建任务】
Step1:点击“采集配置”
Step2:点击【任务列表】中的“+”,新建采集任务
Step3:在如图的红框中输入采集地址和任务名称(可自定义),完成后点击“下一步”。
需要采集正文数据,所以此处需要勾选【链接列表】和【普通翻页】,如图,最后点击“完成”即可。
![7dbb64559925ee7dada07219effdf3f7.png](https://img-blog.csdnimg.cn/img_convert/7dbb64559925ee7dada07219effdf3f7.png)
【新建采集任务】
2. 确认选区
由于我们只需要采集链接列表的数据,故需要过滤掉其他无效数据,保留最终有效数据。这里我们可以使用【确认选区】功能即可轻松筛查,操作如下图所示: