Python网络爬虫:爬取CSDN博文评论 并制作成词云图

本文介绍了如何使用Python爬取CSDN博文的评论,并将评论内容制作成词云图。首先,通过分析网络请求找到评论数据的源地址和关键参数;接着,安装必要的Python模块;然后,编写爬虫代码,利用jieba库进行分词处理;最后,展示生成的词云图效果。
摘要由CSDN通过智能技术生成

hello,大家好,我是wangzirui32,今天来教大家如何爬取CSDN博文评论,并制作成词云图。
开始学习吧!

1. 寻找评论源地址

打开一篇博文,再打开抓包工具Network,发现源地址:
评论数据地址
我们来解析一下返回数据:

{
   ...       # 省略亿些
	"data":{
   
		"list":[
			{
   "info":{
   
				"content":"博主不光能写的一手好代码,还能写的一手好文章。",
				"userName":"Rex__404",
				"digg":1,
				"diggArr":[],
				"parentUserName":null,
				...
				}
			}
...

可以看到,评论数据就在data的list中,遍历每一项的info中的content,就可以爬取评论数据了。
再解析一下URL:

https
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值