![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Chrsitina_S
这个作者很懒,什么都没留下…
展开
-
爬取MV弹幕,制作词云图(一)
一直想要爬弹幕的,本来以为挺高级的,事实上也是挺高级的,哈哈!终于完成弹幕的爬取和词云的制作了!跟大家分享下经验吧!去哔哩哔哩网站找一个mv如果是谷歌的浏览器就比较方便了,右键检查,点击Network,然后要更新,弹幕的文本文件有时候是找不到的,所以先找到一个名为pagelist的json文件,右键open in the web,就可以找到cid了,然后利用cid可以获得弹幕的url链接,chardet.detect主要是对获得的网页进行解码,关键在于只能对字节型解码。最后利用正则表达式匹配中文字符串原创 2020-06-20 17:02:22 · 215 阅读 · 0 评论 -
爬取MV弹幕,制作词云图(二)
词图云的制作费了整整一天,好在功夫不负有心人,成功搞出来了,就在这抓耳挠腮的过程中出现的问题,如何解决的跟大家分享一下!1、导入wordcloud库wordcloud绝对的必不可少,本人用pycharm做的,装wordcloud库的时候出现各种问题,比如settings环境可添加的库中根本就没有wordcloud库,只有一个r-wordcloud2,但是用不了,所以就没办法啊,没有库我怎么装!还有一个方法嘞,直接去这个链接(注意!一定要选对python的版本以及电脑的型号)下载whl后缀的文件。打开c原创 2020-06-20 16:40:37 · 363 阅读 · 0 评论