从情境中学习数据分析,体会数据分析逻辑。
今天给大家分享的案例是关于美食的哦
我们来看看B站美食视频的分析~大家平时喜欢看美食视频吗~
首先,我们把现成的数据包导入,加载
这部分涉及的具体代码这里就不给大家展示了哈
我们把数据集合并
然后开始数据分析,首先先统计一下缺失值
然后,我们要确定从哪些维度去进行分析
- 美食up最喜欢做什么样的食材
通过数据我们可以发现食材可以来自——
标题:50买了一个两斤半的猪肘,小马今天做“红烧猪肘”软烂入味,肥而不腻!
视频介绍: 吃不完的猪肉,直接放冰箱就错了,教您一招,放30天还是新鲜的啊
标签: 美食美食美食制作\n 猪肉\n \n 保存
我们可以对文本进行预处理以及统计词频,画出相关词云,进行查看
对标题中的食材进行统计
对视频介绍中的食材进行分析
那么从上面分析我们可以初步发现,美食up主比较喜欢蛋糕、面包、鸡蛋、面粉、牛奶食材类的美食,这因为喜欢吃甜的,还是因为比较容易操作呢?其次也喜欢做做肉类的食物,比如猪肉,牛肉等。
- 最受欢迎的美食up有什么共同之处?
首先我们计算一下最受欢迎的美食UP的评分 目标是寻找综合得分最高的美食up主播:视频质量高、互动效果最好的UP
我们可以根据播放量,弹幕数,点赞数,金币数,收藏量,分享数以及评论数的总和的视频平均得分来定义最受欢迎的美食up主
然后我们来看看最受欢迎的TOP5美食UP
食贫道', '盗月社食遇记', '李子柒', '绵羊料理', '罗翔说刑法']
纵轴表示主播热度
然后我们来看看这些最受欢迎美食UP之间的共同之处
通过计算美食up主播的流行性评分,我们可以看出——
1.比较受欢迎的美食up主播的视频播放量都会非常高,能够达到百万的两级,比如流行性评分第一名的主播罗翔说刑法的单个视频播放量达到了800+万
2.这些大V主播的运营能力比较强或者具有专业的运营团队,他们视频定位以及标签、简介都很完善,标题同时具有吸引力
3.他们一般喜欢下午或者晚上发布视频,因为大家都下班或者休息了,这样曝光率会更高
③ 浏览/投币比最高的视频?
这个比较简单,我们可以直接通过视频的总播放数以及每个视频的金币数可以达到我们目标视频
如果存在“相同视频” 我们可以对数据进行去重
按照总播放数从大到小排序
投币最多的视频
- 美食视频的热门标签是什么?哪些标签的视频更容易火?
标签的热点词
标签的热点词语
标签的热点短语
从上面视频美食标签的中,我们可以得到一些常见的词语或者词组:
1.视频标签的基础词汇:美食,制作,vlog,挑战,打卡,年度,农村等
2.视频标签的常用词组:美食 制作,打卡 挑战,年度 美食,农村 美食,制作 教程
- 高浏览量的视频的财富密码是什么?
我们按照浏览量,从大到小进行排序
为了有效分析高浏览量的视频的财富密码,我们基于浏览量次数排名前1000的文章进行关键词和时间分析
基于Tfidf关键词和TextRank关键词提取
可以发现先可以知道在浏览量前1000的文章中浏览量分布,其中浏览量最大值为6839000(680万+),最小值295000(29万+),平均值为 742412(74万+),说明这些视频浏览数量都是很高的也比较具有代表性
其次我们通过两种方式:Tfidf和Textrank算法提取标题关键词为:活动,作品,试吃,牛肉,拉面,等
其次不少标题中出现了数字,我们看看还有数字的标题有哪些:从可以看出播放量1000的文章标题中约有43.8%的包含了数字,大多数代表了没试的价格,看来吃货们不仅关心是否好吃,同时还关心是否实惠,明码标价是最好的宣传方式
然后我们来看看这些视频发布时间的规律
每周热门视频发布规律
小时粒度的热门视频分布
从上图可以看出,热门视频集中在中午(11点)、傍晚(16-19点区间),是不是都是在饭点左右哈哈哈哈哈
美食视频在饭点发布比较多,那么其他类型的视频呢?他们的发布时间和规律又是什么样的呢?大家不妨回去之后可以好好思考一下哦~