hello,大家好,我是wangzirui32,今天来教大家如何爬取CSDN博文评论,并制作成词云图。
开始学习吧!
1. 寻找评论源地址
打开一篇博文,再打开抓包工具Network,发现源地址:
我们来解析一下返回数据:
{
... # 省略亿些
"data":{
"list":[
{
"info":{
"content":"博主不光能写的一手好代码,还能写的一手好文章。",
"userName":"Rex__404",
"digg":1,
"diggArr":[],
"parentUserName":null,
...
}
}
...
可以看到,评论数据就在data的list中,遍历每一项的info中的content,就可以爬取评论数据了。
再解析一下URL:
https