马老师曾说,我对钱没有兴趣!于是我用Python分析了马老师的语录,发现...

对于马老师,估计无人不知无人不晓,小编第一次看马老师的演讲点评在是赢在中国上面,对于他的口才我深深折服。里面有很多金句,细想想还是很有益处的。最为津津乐道的是马老师跟撒贝宁的在开讲啦节目上面的对话:我对钱没有兴趣。

也许钱对于他这样的大佬确实没有啥兴趣,小编还在发愁每个月的房租怎么交,还在愁花呗的账单呢

突发奇想,既然是玩Python,不如把马老师曾经讲过的金句和语录进行一个全方位的总结,用Python来盘点一下,看看到底都有些亮点。

01

数据的爬取

我们需要对于数据进行抓取,小编提取的是“名言通”提供的数据,其网址为www.mingyantong.com.由于网页是属于静态网页,因此对于爬取程序的编写相对比较简单,部分如下图所示:

上述的程序中,我们首先构造了请求头,然后根据网页数量构造请求链接,然后分页的来爬取对应的信息,这里我们提取的是每个名句的内容,以及名句的子网页、评论的数量和点赞数量。

02

数据的分析和提取

提取到数据后,接下来是对于数据的分析,我们提取到的数据为:

对于点赞数和评论数我们需要将其转换为int类型的数据,因此可以采用下述的代码进行处理:

03

数据的可视化

1).金句的点赞

我们首先来看一下大家对于金句的点赞情况,如下图所示:

从上图可以看出,大家对于金句的点赞分布绝大多数集中在0-200条之前,而且呈现逐渐递减的趋势,分布极为不均匀。

2).Top5的金句

有了点赞的数量和评论的数量,我们来看一下,点赞数量前五名的金句和评论数前五名的金句分别是哪些。

上图中,字体越大,代表着点赞数或者是评论数越高,我们可以看出,点赞数最高和评论数最高的金句是同一句话,我们可以拿出来单独给大家看一下。

今天会很残酷,明天会更残酷,后天会很美好,但大部分人会死在明天晚上。

这句话也警示我们,凡事需要踏踏实实的坚持到底,才能够会有收获。否则将会一无所获。

3).点赞和评论分布

接下来,看一下点赞数前五的金句,其点赞数和评论数之间的一个分布情况。

上图可以看出,对于评论数量和点赞数量,二者没有过多的关系,点赞数很高的金句,其评论数量有可能会很少,例如上图中第二个句子中,点赞数排名第二,但是评论数却为零。

4).词云分析

最后,我们来看一下我们爬取的马云所有的金句,来制作一个词云,看一下,金句的关键词有哪一些。

我们可以看出,对于马老师的语录中,最重要的关键词有”我们“、”自己“ 、”成功“等等,一定程度上可以说明是以”我们大家“的共同角度,探讨了自身的一些内容,以及如何去成功等一系列的话题。

好了,以上就是小编今天为大家带来的马老师的著名金句,相信大家也会从马老师的金句中有所感悟,你最喜欢马老师的哪一句,欢迎留言区吱一声

近期十大热门:
我总结的80页《菜鸟学Python精选干货.pdf》,都是干货

笑喷了,我用Python帮韦小宝选最佳老婆组合
用Python一键生成炫酷九宫格图片,火了朋友圈

菜鸟也疯狂!8分钟用Python做一个酷炫的家庭随手记

Github获8300星!用Python开发的一个命令行的网易云音乐

一道Python面试题,硬是没憋出来,最后憋出一身汗!
Python高手进阶|实战4大并发秘籍

让你纵横 GitHub 的五大神器

值得收藏!8大技巧,带你了解菜鸟和高手的区别!

卧槽!Pdf转Word用Python轻松搞定!

由菜鸟学Python原班人马打造的公众号【程序员GitHub】,专注于分享GitHub上有趣的资源包括,Python,Java,Go语言前端学习等优质的学习资源,爆料程序员圈的新鲜趣事,热门干货,职场感悟,感兴趣的小伙伴可以来捧场!

点的“在看”,否则就看不到我了555
展开阅读全文

Windows版YOLOv4目标检测实战:训练自己的数据集

04-26
©️2020 CSDN 皮肤主题: 大白 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值