前嗅教你大数据:采集孔夫子旧书网

l 采集网站

【场景描述】采集孔夫子旧书网数据。

【源网站介绍】孔夫子旧书网是国内专业的古旧书交易平台,汇集全国各地13000家网上书店,50000家书摊,展示多达9000万种书籍;大量极具收藏价值的古旧珍本(明清、民国古籍善本,珍品期刊,名人墨迹,民国珍本,绝版书等)在孔网展示与交易,吸引了大量的学者、研究人员和藏书人长时间在线关注并参与。

【使用工具】前嗅ForeSpider数据采集系统,免费下载:

ForeSpider免费版本下载地址

【入口网址】https://book.kongfz.com/Cxianzhuang/cat_8002/

【采集内容】

采集孔夫子旧书网中书籍的标题、作者、价格、介绍详情等基本信息。

图片

【采集效果】

如下图所示:

图片

思路分析

配置思路概览:

图片

 l 配置步骤

1. 新建采集任务

选择【采集配置】,点击任务列表右上方【+】号可新建采集任务,将采集入口地址填写在【采集地址】框中,【任务名称】自定义即可,点击下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值