python用来做什么好吃_徐大sao吃了哪些好吃的?用Python生成词云,一目了然!

我们可以点击XHR(xhr,全称为,用于与服务器交互数据是ajax功能实现)看看有没有接口,经过寻找发现有可能存在接口。

右键在新的窗口中打开(右键点击Open in new tab),看看是不是:

下图可以看到,的确获得了视频的标题,那么蓝框中的参数是什么意思呢?

经过观察,不难发现,在徐大sao的视频页面中,每行有5个视频,共有6列,一共是30个视频。所以我们能够大胆的猜测,ps=30这个参数,应该就是目前视频标题数量。

那么pn呢,默认pn=1,翻页不难发现,pn随着翻页而改变,pn就是page number的缩写,一共是17页面。

那就简单了,我们只需要get请求17次就能抓取到所有数据了。

数据的清洗:

上面get获取到的json数据,不光是标题,还有简介,评论数等各种信息,我们这里格式化一下json看一下json数据格式,方便我们清洗。

用json数据格式化工具格式化之后,可以看到标题title在data的list下面的vlist里面。

码代码:

经过我们的分析,短短几行代码就能获取到第一页的所有视频标题:

我们只需要优化一下代码,做个循环,就能获取到徐大sao所有的视频标题:

这样我们就得到了,所有的视频标题,并存在了一个列表中。

俗话说,磨镰不误砍柴工。我们现在安装一下jieba模块用来分词,统计词频,用wordcloud模块来生成词云。

安装jieba模块,只需要执行pip install jieba

安装wordcloud模块对于新手来说是个问题,如果直接执行pip install wordcloud,windows下会报错,我们用wheel方式来安装。

首先打开 lfd.uci.edu/~gohlke/pythonlibs/ ,然后按下Ctrl +F 输入 wordcloud并搜索。

找到合适自己的版本并下载,我这里安装的是python 64位的 3.7版本,那么就下载wordcloud-1.6.0-cp37-cp37m-win_amd64.whl。

然后执行pip install wheel安装wheel模块,

接着执行 pip install wordcloud-1.6.0-cp37-cp37m-win_amd64.whl注意替换成你下载的模块:

jieba分词模块基础功能

输出:用sao式老方做一盆热干面 ,一斤面不够吃 ,酱香浓郁,一口就上瘾

词云模块的基础功能,将上面一句话生成词云看看:

结果为:

OK,迫不及待,我们直接分析,所有标题的结果吧!

得到结果,字体越大,频率越高。不难发现,大sao最喜欢吃大蒜米饭,这些,并且非常过瘾。

但是这里面有各种各样的词汇,我们想知道徐大sao吃了哪些好吃的,可以将名词选出来。

案例:

那么n就代表名词,我们用名词做一个词云。

代码如下:

OK,一目了然,到这里我们看到,大sao吃的最多的就是大蒜,米饭,面条,各种面。看来“碳水教父”的称号果然名不虚传啊。

那要是给各个词排个名次,统计出现的具体次数该怎么做呢:

输出结果如下:

可以看到,大蒜,出现了足足134次,远远超过第二名!!!其次是米饭,辣椒,火锅,面条。

真是离不开,辣和碳水。

会了这种方法,你就可以为你喜欢的美食博主做个分析啦!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值