Python
文章平均质量分 52
猫宁阿白
这个作者很懒,什么都没留下…
展开
-
站在巨人的肩膀上做数据分析-实习僧网站分析
爬虫参考:破解“实习僧”网站字体加密数据处理及分析参考:实习僧网站数据分析我只爬取了关键字为‘数据分析’的前20页数据,作为练习。预处理后的字段有:1. 在招职位数量各城市招聘职位数量:各城市职位数量占比:职位数量最多的五个城市占总数量的比重:因为我在成都,所以看看成都在招数量最多的五家公司及其招聘职位数:虽然数据量本身小了些,但是依然求职艰难2. 薪资情况先看日均薪酬:以城市为单位查看日均薪资:...原创 2018-04-22 21:30:06 · 550 阅读 · 0 评论 -
站在巨人的肩膀上做数据分析-网易云音乐哥哥张国荣《这些年来》热评词云
代码参考:爬取了陈奕迅新歌《我们》10万条评论数据发现:原来,有些人只适合遇见1. 找到评论url与请求方式:header与form data(忽略信息解密)2. 抓取热门评论3. 热评词云4. wordcloud练习:按图片的形状和颜色布局生成词云from wordcloud import WordCloud, ImageColorGeneratorimport matplotlib.pypl...原创 2018-04-23 20:09:53 · 549 阅读 · 1 评论