【pyecharts】b站用户对于游戏《原神》的评价分析
背景
原神是一款近两年比较火的游戏,本项目利用采集的1万多条评论数据,进行一些简单的分析
专栏和往期项目
👉往期文章可以关注我的专栏
下巴同学的数据加油小站
会不定期分享数据挖掘、机器学习、风控模型、深度学习、NLP等方向的学习项目,关注不一定能学到你想学的东西,但是可以学到我想学和正在学的东西😀
数据和代码下载
数据导入与说明
背景描述
b站用户对于游戏《原神》的评论,最近的1w+条评论
数据说明
user_name 用户名称
user_level 用户等级
grade 评分
content 评论内容
publish_time 发布时间
down_count 点踩数
reply_count 回复数
up_count点赞数
import pandas as pd
df = pd.read_excel('/home/mw/input/data9801/B站原神评论.xlsx')
df.head()
数据分布
评论用户等级
可以看出,评论用户主要是3、4、5级的b站用户,占据了本数据的78%以上,其中5级用户评论数最多,占比32.14%;
,2级和6级用户则相对较少,分别占有13.8%和7.66%,少量的0级用户是已注销用户,暂不分析
众所周知,混迹b站时间越久,互动越多,等级越高,可以看出,评论者大部分是b站的长期用户
评分等级
可以看出,在这一万条评论中,更多的用户愿意给出10分的满分
平均点赞、点踩、回复数目
down_count reply_count up_count
评论文本长度
组合分析
用户等级与评分
不同等级用户给出的平均分
可以看出,高等级用户更倾向于打低分,并且2,3,4级用户更倾向于给出高分,而5,6级用户给出的均分相对较低
用户等级与评分高低热力图
比较有趣的是,2,3,4级用户给出满分十分的占比更高一些,而5,6级用户评价则有些两极分化,给出最低分2分和最高分10分是5个档次中最多的
用户等级、评价分数与评论长度的关系
用户等级与评论长度
为了方便可视化,我们将评论长度大于500的都看作500
很容易看出,相对于2,3级用户,高等级用户更愿意挥毫泼墨,敲击手中的键盘留下更多的评论
评价分数与评论长度的关系
可以看出,给10分的用户评论字数明显少于给出其他分数的用户,给4分、6分、8分的用户更愿意多写一些文字