python爬虫（爬取京东商品评论）

最新推荐文章于 2025-03-15 22:11:44 发布

MaximusCoder

最新推荐文章于 2025-03-15 22:11:44 发布

阅读量9.6k

点赞数 84

分类专栏：大学文章标签：开发语言 python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Arthur_WangYu/article/details/136606694

版权

前言

如果只需要代码可以跳转到最后一步（记着更换商品ID和评论页的的页数）

话不多说，直接开干！

文章所提供的代码不能用于商业用途仅建议学习交流使用否则后果自负
部分代码来源于网络如有侵权私我立删谢谢

今天要干的活

京东某口罩产品的全部评价，要爬取的数据

最终结果

遇到问题（重点！！）

今天使用的方法就是用requests请求获取页面数据返回并且分析其结果。

今天的重点在于京东商品全部评价的问题。我们今天要爬取的这个商品评论显示的数据为10w+的但是我们会发现一个页面只有10条就算显示全部页面也只有100页那么就是1000多条那么！剩下的数据去了哪里呢？？你品你细品？？

我在网上查阅了很多资料发现很多博主都是直接爬取100页这样将会导致数据的不完整。最终我在csdn网站上一位博主的文章下面发现了此问题的解决方法（真的很强）

链接：https://blog.csdn.net/hgjiayou/article/details/109777572.

我总结下此文章的内容！

假如一个商品全部评论数据为20w+ 默认好评15w+ 这15w+的默认好评就会不显示出来。那么我们可以爬取的数据就只剩下5w+ 接下来我们就分别爬取全部好评好评中评差评追加评价但是就算这些数据加起来也仍然不足5w+ 上文的博主猜测可能有两点原因：

1.出现了数据造假，这个数字可能是刷出来的（机器或者水军）
2.真的有这么多的评论，但这时候系统可能只显示其中比较新的评论，而对比较旧的评论进行了存档。

在博主理论的基础上我也进行了很多相应的测试，就是说无论如何我们最终都爬不到剩下的5w条数据只能爬取一部分但这一部分数据也将

最低0.47元/天解锁文章

博客等级

码龄4年

54
原创

742
点赞

731
收藏

291
粉丝

关注

私信

热门文章

分类专栏

大学 47篇

展开全部收起

上一篇：: 计算机专业考研的科目

下一篇：: 你们在科研学习中一般使用哪些软件工具来看论文记笔记？

最新评论

python爬虫（爬取京东商品评论）
修修菜勾: 你好，想问一下，爬出来是空白的，代码也能运行，但是就是显示"活动太火爆了，已优先为您接入快速通道，稍安勿躁，请返回上一页重新尝试下，这个问题怎么解决？是被反爬了吗？
python爬虫（爬取京东商品评论）
a56335356: 只改了商品ID，用记事本打开csv文件，utf8格式，不是乱码
python爬虫（爬取京东商品评论）
younger_chen: 找payload中的解码视图，有解码后的body就跟博主的url一样了，实际上就是把ID代入就行了
python爬虫（爬取京东商品评论）
younger_chen: 感谢！！难怪我说为啥都是乱码
python爬虫（爬取京东商品评论）
younger_chen: 还是network那里找到payload有已解密的视图可以看到解码后的body,其实基本上就是改一下id，其他的就跟作者的url一样

最新文章

目录

展开全部

收起

评论 38

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

MaximusCoder 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。