用爬虫批量采集阿里巴巴1688商品数据

本文主要介绍如何使用后羿采集器的智能模式,免费采集阿里巴巴批发网商品的批发价格、发货时间、是否代发等信息。

采集工具简介:

后羿采集器

采集字段:

商品标题、商品链接、图片链接、标签1、标签2、标签3、价格、30天成交数、 评价、店铺

功能点目录

如何对采集字段进行配置

如何采集列表+详情页类型网页

采集结果预览:

下面我们来详细介绍一下如何免费采集1688批发网的商品数据,我们以“羽绒服女”为例,具体步骤如下:

步骤一:新建采集任务

1、复制1688羽绒服女的网页(需要搜索结果页的网址,而不是首页的网址)

2、新建智能模式采集任务

您可以在软件上直接新建采集任务,也可以通过导入规则来创建任务。

点此了解如何导入和导出采集规则。

步骤二:配置采集规则

1、设置提取数据字段

软件自动识别出字段后,我们可以右击字段进行相关设置,包括修改字段名称、增减字段、处理数据等。

点此了解如何对采集字段进行配置。

在列表页上,我们需要采集商品标题、商品链接、价格及标签等信息,字段设置效果如下:

2、使用深入采集功能提取详情页数据

在列表页上只展示出了1688批发网商品的部分信息,如果需要商品的详细信息,我们需要右击商品链接使用“深入采集”功能,跳转到详情页进行采集。

点此深入了解如何采集列表+详情页类型网页。

字段设置效果如下:

步骤三:设置并启动采集任务

点击“保存并启动”按钮,可在弹出的页面中进行一些高级设置,包括定时启动、自动入库和下载图片,本次示例中未使用到这些功能,直接点击“启动”运行爬虫工具。

步骤四:导出并查看数据

 

再为您推荐几个关于电商的采集教程:

如何免费采集淘宝商品信息数据

如何免费采集京东商品信息数据

如何免费采集亚马逊商品信息数据

转载于:https://www.cnblogs.com/houyicaiji/p/10271413.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值