网页版douyin.com评论获取二

北愚

已于 2024-04-06 13:52:46 修改

阅读量346

点赞数 3

分类专栏：抖音评论文章标签： python 网络爬虫

于 2024-04-06 12:57:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yj2094632273/article/details/137425537

版权

抖音评论专栏收录该内容

2 篇文章 0 订阅

订阅专栏

书接上回，现在已经得到了数据了，接下来就是解析了

一、json.loads()模块

返回的数据都是以字符串的格式，这对于我们对其进行分析和解析使用是非常不利的，毕竟没人想要用正则来匹配这么多字符。

在python的内置模块中，有一个json模块可以帮助我们将response.text由字符串转为json格式

json_text = json.loads(response.text)

然后我们将每一次得到的数据放到支持json格式化的网页上，进行解析分析。

二、用json规则提取我们需要的信息

（一）解析结果

使用解析工具，每一次请求我们就得到了类似

这样格式的数据内容，然后就是分析这些内容在浏览器的渲染出的结果是什么，并进行提取。

（二）提取评论

1.其实找出每个对象它所对应的位置就是重复的对比以及用变量名去猜测以及对应。

2.在本例中评论就是在comments中，所以我们直接

comments = json_text["comments"]

得到的内容就是请求得到的评论内容以及一些其他属性，继续进行json格式化分析

可以看到其实就是一个comments列表，只需要对这个列表进行循环处理其中的每一个字字典，就可以得到想要的评论和其他数据内容了。就类似于上述的取到comments的步骤一样，这里不做演示了哈！但是注意cid这个属性内容，下一篇会用到。

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
网页版douyin.com评论获取二

可以看到其实就是一个comments列表，只需要对这个列表进行循环处理其中的每一个字字典，就可以得到想要的评论和其他数据内容了。返回的数据都是以字符串的格式，这对于我们对其进行分析和解析使用是非常不利的，毕竟没人想要用正则来匹配这么多字符。这样格式的数据内容，然后就是分析这些内容在浏览器的渲染出的结果是什么，并进行提取。得到的内容就是请求得到的评论内容以及一些其他属性，继续进行json格式化分析。然后我们将每一次得到的数据放到支持json格式化的网页上，进行解析分析。二、用json规则提取我们需要的信息。
复制链接

扫一扫

专栏目录

博客等级

码龄1年

9
原创

105
点赞

121
收藏

73
粉丝

关注

私信

热门文章

分类专栏

逆向 2篇
爬虫 2篇
抖音评论 2篇
tools 1篇

最新评论

笔**阁小说采集
CSDN-Ada助手: 恭喜作者发布第8篇博客“笔**阁小说采集”，持续创作的精神令人钦佩！建议在下一步的创作中，可以尝试探索更多不同的题材和风格，让读者在阅读中有更丰富的体验。期待您的更多精彩作品！愿您在创作的道路上不断进步，感谢您的分享！
网页版douyin.com评论获取一
CSDN-Ada助手: 恭喜用户写了第三篇博客！看得出您对网页版douyin.com评论获取有深入的研究和积累，希望您能继续保持这份热情和耐心，坚持不懈地创作下去。接下来，建议您可以尝试结合实际案例或者教程分享，让读者更加深入地了解这个主题，也能够带来更多的启发和帮助。期待您更多的精彩作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
网页版douyin.com评论获取二
CSDN-Ada助手: 恭喜作者成功发布第四篇博客！继续分享关于网页版douyin.com评论获取的内容，让读者们受益匪浅。建议在下一篇博客中，可以深入探讨如何利用评论数据进行情感分析，或者分享一些评论获取的实用技巧。期待您更多精彩的创作！加油！祝您一切顺利！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
yolov5使用labelimg数据标注——classes.txt的覆盖问题
CSDN-Ada助手: 非常棒的博客内容！你对yolov5使用labelimg数据标注中的classes.txt的覆盖问题进行了详细的说明，让读者能够更好地理解这个问题并解决它。希望你可以继续分享更多关于数据标注和深度学习领域的经验和技巧。在这个主题上，除了追加classes.txt文件之外，你还可以尝试使用不同的数据标注工具，比如LabelImg、CVAT等，来提高效率和准确性。此外，了解如何处理不同类别之间的标注重叠、数据增强等技术也会对你的工作有所帮助。希望这些建议能够对你的未来博客创作有所启发！期待看到更多精彩内容。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
DrissionPage浏览器配置
北愚: 直接搜索上一级函数名字也行

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。