央视最美记者王冰冰火爆B站,单个视频1800万播放,都说了啥?

公众号关注 “菜鸟学Python”

434篇原创,设为 “星标”,一起学编程!

提起央视最近最火的女记者,想必很多的小伙伴都会第一时间想到王冰冰,她凭借着自己甜美的笑容,火遍了各大流量平台,被大家封为了“央视最美女记者”。

在2020年的最后一天里,王冰冰在B站发布了自己第一条个人视频。在10小时的时间吸引了百万的粉丝,冰冰的第一条个人Vlog视频的播放量就达到了1800+万播放量,并且持续霸占着B站热门排行榜的前三位置。

小编也是冰冰的粉丝,非常喜欢看冰冰的主持节目。既然是玩Python,不如用Python来分析一下冰冰的1800+万播放量的Vlog,看看大家都说了啥。

01.弹幕处理
对于弹幕的抓取,我们可以采用bilibili-api来直接进行获取。几行代码就可以搞定。程序如下所示:

上图中,我们调用bilibili-api来完成对比弹幕信息的抓取,包括弹幕发送的时间、弹幕内容以及弹幕的颜色。需要注意的是,由于bilibili-api不同版本之间兼容性很差,所以这里要说明我们用的是1.3.4版本的bilibili-api。

由于B站对弹幕的内容仅仅开放一千条数据,所以我们只能获取到一千条弹幕信息。但是这里面依旧包含着非常多的信息,例如大家对于弹幕颜色的使用,程序如下图所示:

上述的程序中,统计了颜色使用率最高的前五种颜色,在可视化程序中,利用饼形图,将每一块区域的颜色都设置成为对应的使用颜色,如下图所示:

可以看到,在使用的颜色分布中,大家用的最多的颜色就是B站弹幕默认的白色,其次的话就是红色、黄色等颜色。

02.弹幕的内容:

而针对于弹幕的内容,同样展现出大家的所思所想。通过弹幕的词云展示,可以更加直观的体现出大家对冰冰的喜爱。

通过对于弹幕内容的可视化,体现了大家对于冰冰的支持和喜爱,而且评论的内容都是非常积极向上的,评论内容包含了“冰冰”、“这次一定”等高频词汇。

03.评论分析

虽然B站的弹幕信息开放较少,但是对于大家的评论信息却完全的开放。我们可以通过抓取大家的评论,看看大家都是如何评价冰冰的的第一个Vlog视频的。对于评论的抓取,直接采用下述的代码即可。

上述的程序中,需要注意的是对于视频oid数值的获取,不同网页视频之间的区别就在于oid数值的不同。对于oid的数值获取如下图所示。

大家只需要在视频网页中打开开发者模式下的network,然后找到reply开头的元素,向下滑动即可找到oid的数值。

里我们抓取到了前2000页的评论信息,包含了评论者的姓名、等级、性别和评论的内容。经过去重处理后,一共有三万八千条数据。通过代码:Counter(df.names).most_common(10),我们对于评论者姓名进行统计,我们发现了评论次数最多的是名字为“拉風的名字”的用户,评论次数达到了149次。

而在用户的性别的统计可视化中,其结果如下图所示:

在抓取到的评论者数据中,大部分的人将自己的性别进行保密,而在知晓性别的情况下,可以看到,评论者的男女比例达到了3:1。对于冰冰的视频,还是男生看的比较多。

而在用户的等级分布中,结果如下图所示。

从图中,可以看到,用户的等级分布呈现出类似高斯分布的分布特征。用户的等级从2级到5级呈现快速上升的趋势,等级为5的评论用户数量最多,达到了42.7%的占比。可见观看冰冰视频的都是B站的铁粉了。而用户等级为6级的数量则是迅速回落。与2级评论用户的数量几乎持平。

相比于弹幕视频的评论内容,大家的评论里又说了些什么呢?相比于弹幕信息,评论信息中会存在大量的表情包,这些表情包会在文字中以[xxx]的形式表现,所以我们在提取大家的评论信息时,需要先将表情包进行剔除,然后再匹配文字并制作词云。

上述的程序中,我们充分利用正则表达式的优势,剔除掉表情包的信息,然后匹配评论信息中的中文,写入到本地的文件当中。对于评论的词语可视化,其结果如下图所示。

可以看出,评论区中大家对于冰冰第一条Vlog的评价与弹幕信息在内容上并没有太大的区别,但是在高频词汇上有一定的不同。但是总的来说也是充满了对于冰冰的喜爱。

好了,以上就是我对冰冰1800万视频的分析,如果你也是冰冰的粉丝,欢迎在留言区吱一声,说说你的看法哦。

我是菜鸟哥,一个喜欢玩Python的码农,我们下篇见。

程序员GitHub,现已正式上线!

接下来我们将会在该公众号上,专注为大家分享GitHub上有趣的开源库包括Python,Java,Go,前端开发等优质的学习资源和技术,分享一些程序员圈的新鲜趣事。

年度爆款文案

点这里,获取新手福利
  • 10
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值