2024年Python最新Python爬虫入门教程27：爬取某电商平台数据内容并做数据可视化

最新推荐文章于 2024-06-03 11:07:25 发布

2401_84584609

最新推荐文章于 2024-06-03 11:07:25 发布

阅读量376

点赞数 29

分类专栏：程序员文章标签： python 爬虫信息可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84584609/article/details/138366464

版权

本文介绍了一种使用Python爬虫从当当网抓取畅销书籍信息的方法，包括标题、推荐、评价、作者等字段，并将数据保存到CSV文件。接着，利用数据可视化工具对书籍的价格区间、出版社数量和电子书占比进行了展示，包括饼图和柱状图。同时提供了详细的代码实现和后续的视频教程计划。

摘要由CSDN通过智能技术生成

‘详情页’])

csv_writer.writeheader()

for page in range(1, 26):

print(f’正在保存第{page}页数据内容===========')

url = f’http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-year-2017-0-1-{page}’

headers = {

‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36’

}

response = requests.get(url=url, headers=headers)

print(response.text)

selector = parsel.Selector(response.text)

lis = selector.css(‘.bang_list_mode li’)

for li in lis:

title = li.css(‘.name a::attr(title)’).get() # 标题/书名

recommend = li.css(‘.tuijian::text’).get() # 推荐

star = li.css(‘.star a::text’).get() # 评价

author = li.css(‘div:nth-child(5) a:nth-child(1)::attr(title)’).get() # 作者

date = li.css(‘div:nth-child(6) span::text’).get() # 出版日期

press = li.css(‘div:nth-child(6) a::text’).get() # 出版社

price_r = li.css(‘.price .price_r::text’).get() # 原价

price_n = li.css(‘.price .price_n::text’).get() # 售价

price_e = li.css(‘.price_e span::text’).get() # 电子书价格

href = li.css(‘.name a::attr(href)’).get() # 详情页

dit = {

‘标题’: title,

‘推荐’: recommend,

‘评价’: star,

‘作者’: author,

‘出版日期’: date,

‘出版社’: press,

‘原价’: price_r,

‘售价’: price_n,

‘电子书价格’: price_e,

‘详情页’: href,

最低0.47元/天解锁文章

关注

29
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
2024年Python最新Python爬虫入门教程27：爬取某电商平台数据内容并做数据可视化

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~给大家准备的学习资料包括但不限于：Python 环境、pycharm编辑器/永久激活/翻译插件python 零基础视频教程Python 界面开发实战教程Python 爬虫实战教程Python 数据分析实战教程python 游戏开发实战教程Python 电子书100本。
复制链接

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄132天

128: 原创

-: 周排名

-: 总排名

8万+: 访问

: 等级

3001: 积分

1245: 粉丝

1681: 获赞

11: 评论

1702: 收藏

私信

关注

热门文章

分类专栏

程序员 120篇

最新评论

python模块—logging_no handler could be found for root python
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
Java最新不服不行！Github即将爆火的《高并发秒杀顶级教程》，先睹为快，华为架构师深入讲解Java开发
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
手把手带你学习微信小程序 —— 十（icon 标签【微信默认标签】(1)
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
最新21张让你Python突飞猛进的速查表_python速查表(1)
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
2024年Java工具类：DateTool（时间工具类），初级java开发常见的面试题
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。