l 采集网站
【场景描述】采集孔夫子旧书网数据。
【源网站介绍】孔夫子旧书网是国内专业的古旧书交易平台,汇集全国各地13000家网上书店,50000家书摊,展示多达9000万种书籍;大量极具收藏价值的古旧珍本(明清、民国古籍善本,珍品期刊,名人墨迹,民国珍本,绝版书等)在孔网展示与交易,吸引了大量的学者、研究人员和藏书人长时间在线关注并参与。
【使用工具】前嗅ForeSpider数据采集系统,免费下载:
【入口网址】https://book.kongfz.com/Cxianzhuang/cat_8002/
【采集内容】
采集孔夫子旧书网中书籍的标题、作者、价格、介绍详情等基本信息。
【采集效果】
如下图所示:
l 思路分析
配置思路概览:
l 配置步骤
1. 新建采集任务
选择【采集配置】,点击任务列表右上方【+】号可新建采集任务,将采集入口地址填写在【采集地址】框中,【任务名称】自定义即可,点击下