复制代码
(
df.groupby(‘上中下’).agg(弹幕数=(‘ids’, ‘count’),
时长=(‘时间’, ‘max’)
).reset_index().style
.bar(subset=‘弹幕数’, align=‘zero’)
.bar(subset=‘时长’, color=‘orange’, align=‘zero’)
)
复制代码
基本上第1期的每集弹幕都是拉满状态(1分钟360条)
2. 弹幕整体词云
这里用的是此前的词云制作工具《》进行绘制
从整体词云,我们可以发现观众老爷们基本都是在哈哈哈的笑声与啊啊啊的赞叹声中看完的。
不得不说,这个综艺很快乐
我们去掉这些拟声词
以及一些溢美之词
,再看看,可以发现大湾区(主要是指陈小春、谢天华、林晓峰、张智霖、梁汉文古惑仔
组合)、赵文卓、李承铉、欧阳靖和张云龙等嘉宾们最受弹幕用户喜爱!
3. 点赞最多的弹幕
点赞前10的弹幕都集中在第1期的中集部分,且绝大部分(前4条都是)集中在赵文卓出场表演的那段,把《流星雨》唱成流星锤
,哈哈哈!
(
df.sort_values(by=‘v2_up_count’, ascending=False).head(10).style
.hide_index()
.hide_columns([‘ids’,‘uid’,‘time’])
)
复制代码
点赞第三的“陈小春:女儿真好
”是在介绍赵文卓时的朋友送祝福阶段赵文卓的儿子女儿的祝福时镜头给到的陈小春,然后有网友给出的经典弹幕,很温馨有没有!
“终于知道戚薇的快乐了
”这条高赞弹幕一定是一个女性网友想出来了,出自39分钟区间李承铉演唱《天上飞》时,帅炸全场!
4. 最疯狂的弹幕狂魔
看到弹幕里有不少二刷、三刷的多刷观众,有多少观众是弹幕狂魔,我们来探一探!
df.groupby(‘uid’)[‘ids’].count().sort_values(ascending=False).to_frame(‘弹幕数’).reset_index().head()
复制代码
我们可以看到,有网友居然在4个半小时的第1期里一共打出了176条弹幕,平均0.65条弹幕/分钟
,毫无疑问的弹幕狂魔!
抽样20条该网友的弹幕内容,我们发现他是真的爱这个节目,而不是只为某个哥哥而来!
(
df[df[‘uid’]==3752327606].sample(18).style
.hide_index()
.hide_columns(subset=‘ids’)
)
复制代码
5. 弹幕最热的哥哥们
那么第1期三集33位
哥哥们共4个半小时
的表演,最受弹幕欢迎的是哪几位哥哥呢?
从弹幕整体词云可看到关键词最多的是大湾区(主要是指陈小春、谢天华、林晓峰、张智霖、梁汉文古惑仔
组合)、赵文卓、李承铉、欧阳靖和张云龙。
大湾区的哥哥们
df[df[‘content’].astype(‘str’).str.contains(‘大湾区|小春|春哥|谢天华|林晓峰|张智霖|梁汉文’)]
复制代码
赵文卓
df[df[‘content’].astype(‘str’).str.contains(‘赵文卓|卓哥|文卓’)]
复制代码
哈哈哈
,笑死
,大威天龙
李承铉
那个,戚薇的快乐李承铉,直呼太帅了
df[df[‘content’].astype(‘str’).str.contains(‘李承铉|戚薇’)]
复制代码
欧阳靖
说唱歌手欧阳靖
df[df[‘content’].astype(‘str’).str.contains(‘欧阳靖’)]
复制代码
张云龙
言承旭张云龙“乘龙快旭”好甜,张云龙第一次看见言承旭,激动地上前直接握住对方的手然后脱口而出:“我以前模仿过你!”
df[df[‘content’].astype(‘str’).str.contains(‘张云龙|云龙’)]
复制代码
关于更多弹幕数据或哥哥们的弹幕,大家可以后台回复955在芒果TV文件夹获取,然后就自己玩玩呗~!
6. 弹幕如何评价这一次的芒果台?
看到很多弹幕都在夸这次的芒果台
df[df[‘content’].astype(‘str’).str.contains(‘芒果’)]
复制代码
7. 弹幕数据采集程序
贴源码咯
import requests
import pandas as pd
headers = {
“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36”,
}
datas = []