词云
文章平均质量分 80
weixin_36605200
这个作者很懒,什么都没留下…
展开
-
python爬虫实战---猫眼电影:西虹市首富的评论抓取
本文旨在抓取电影的评论,包括电影评论者的昵称、来自的城市、评论内容、评分以及评论的时间,并将这些内容抓取下来保存到txt文本里面,并对其中的评论内容去重,并生成词云。导入库from urllib.error import HTTPError,URLError---异常处理from collections import defaultdict---创建列表from wordcloud i...原创 2018-08-22 08:10:38 · 2564 阅读 · 3 评论 -
python爬虫实战---微信好友的获取
本次主要对微信好友的信息获取,包括微信备注名称、省份、城市、个性签名、性别,对其中的个性签名就行词云的制作和对性别的统计。由于微信好友城市分布不多,主要都是集中在一个地区,所以就做地区分布图也没有什么意义;数据存储到mysql当中。导入包from wxpy import Bot---微信机器人from PIL import Image---图片处理from wordcloud im...原创 2018-09-07 19:52:15 · 922 阅读 · 0 评论 -
python爬虫实战---网易云音乐评论抓取
本文主要是提取网易云音乐中歌曲的评论时间、评论者昵称、评论内容,并把数据写进csv文件里面,读取文件里面存储的评论内容,根据指定的背景图制作词云,抓取目标https://music.163.com/#/song?id=1299557768,2018年八月最热新歌TOP50中的Animal歌曲。引言网易云大厂一般都对自己的数据做了很好的加密,一般直接爬取都爬取不到数据,这也是爬取当中一个很头...原创 2018-09-02 20:17:14 · 16608 阅读 · 6 评论 -
python爬虫---酷安(安卓app的聚集地)
酷安最近app用荒了,想要看看有些哪些好玩的app可以安装下来玩玩,酷安就是安卓应用的聚集地网页内容模块import requests--网页请求import time--延时import traceback--输出异常from multiprocessing import Pool--多进程from lxml import etree--解析数据from pymysql i...原创 2019-06-08 13:37:16 · 3816 阅读 · 2 评论