爬虫
Simone Zeng
这个作者很懒,什么都没留下…
展开
-
requests入门——jwzx照片爬取
这是一个比较好玩的项目,爬取jwzx上面同学的照片爬取步骤1. 登录后 打开自己的照片页面这里右键点击照片,在新页面打开就可以得到这个页面。我们会发现url的规律,改变后面的学号,我们就可以得到其他小伙伴的照片了。2. 找到自己的user_agent 和 cookie我们会发现,如果没有登录,是无法打开这个照片页面的,而cookie就是告诉网页我们登录好啦的东西。维基上面对c...原创 2019-12-03 12:49:57 · 793 阅读 · 2 评论 -
数据可视化(一)——wordcloud词云
本篇博客将从词云基础,到实现一个词云实例一、安装及介绍首先,wordcloud 肯定需要相关的安装包。这里我们需要用到:from os import pathfrom scipy.misc import imreadimport matplotlib.pyplot as pltimport jiebafrom wordcloud import WordCloud, STOPW...原创 2019-08-12 23:10:11 · 2569 阅读 · 2 评论