爬虫
mandala -chen
这个作者很懒,什么都没留下…
展开
-
使用jieba分词+pyecharts+request库爬取bilibili视频评论并统计词频可视化
环境:python 3.Xpyechartssnapshot_phantomjsnumpy as nppandas as pdjiebacodecsrequestsreossysjson#数据爬取 利用bilibiliapi接口# B站API详情 https://github.com/Vespa314/bilibili-api/blob/master/api.mdi...原创 2020-04-15 20:08:43 · 728 阅读 · 0 评论 -
爬虫爬取中文文本和标签内容乱码问题解决(并顺便解决了如何将xpath对象以列表的形式存储)
最近写爬虫的时候爬取中文文本时,遇到中文乱码,试了很多方法头都大了终于找到一种自己可以解决乱码的方法(本次爬虫中使用的是request+xpath解析的组合):from lxml import etreeimport pandas as pdimport requests#定义两个列表cont=[]cont_text=[]#这一步就是请求数据嘛,并且返回byte型数据,r=requ...原创 2019-12-07 17:01:47 · 1195 阅读 · 0 评论