
你每年能读几本书?
2018年,我国人均数字阅读量为12.4本;
2019年,我国成年人均纸质图书阅读量为4.65本。
粗略计算,我国人均每年可以读17本书,平均每月1.5本。按照从18岁成年到77岁的人均寿命计算,人的一生可以读1020本书。
当当网上的图书数量是多少?
经济类:614873 本
管理类:1049148 本
历史类:607259 本
小说类:1564887 本
可见时间有限,现代文明的成果想尽情享用还是心有余而力不足,反而应该珍惜花费时间和精力去读的那1020本书。
在读书这件事上,选书才是最重要的。
亚马逊和当当的图书排行榜、名人推荐的书单、豆瓣的书评等,都可以帮助我们先做好选书这关键的第一步。
本篇文章以当当网畅销书榜为例,侧重Web Scraper的入门,爬取的内容比较简单,先掌握完整的爬虫流程,能够顺利导出爬取的数据。复杂多变的内容爬取会在后面的教程中一一讲解。
01 爬取的榜单和内容
进入当当畅销书榜单,选择近30天的畅销书,默认展示前20本,我们就对这20本的「书名」进行采集。
榜单网址:
http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-recent30-0-0-1-1

本文通过实例介绍了如何使用Web Scraper爬取当当网近30天畅销书的书名,详细解析了创建爬虫项目、配置选择器、执行爬虫程序以及导出数据至CSV文件的步骤,旨在帮助读者掌握基本的爬虫流程。
最低0.47元/天 解锁文章
4074

被折叠的 条评论
为什么被折叠?



