使用Python分析网易云歌曲评论信息，通过可视化处理我发现了这些有趣的规律

最新推荐文章于 2024-06-29 13:57:34 发布

天天开心学编程

最新推荐文章于 2024-06-29 13:57:34 发布

阅读量3k

点赞数 3

文章标签： python

本文链接：https://blog.csdn.net/m0_64355682/article/details/124144411

版权

本文利用Python分析网易云音乐热评数据，通过时间处理、评论数量、词云、用户年龄、地区分布和粉丝性别等多个角度，揭示了用户评论习惯和粉丝特征。例如，用户更倾向于在下午和晚上评论，年轻粉丝占多数，广东和四川的评论活跃度高，女性粉丝比例较高。

摘要由CSDN通过智能技术生成

数据来源

首先是数据来源，来自网易云音乐热评，代码这里就不放出来了，调用了API获取的，抓取难度就少了许多，这里不在赘述了。

分析过程

时间处理

下面的代码主要是评论时间分布，主要是针对时间列做了数据处理，常规操作，你也对照的去以日期和月份去挖掘下有意思的事情。

import pandas as pd
from pyecharts import Line

# 读取数据
df = pd.read_csv('music_comments.csv', header=None, names=['name', 'userid', 'age', 'gender', 'city', 'text', 'comment', 'commentid', 'praise', 'date'], encoding='utf-8-sig')
# 根据评论ID去重
df = df.drop_duplicates('commentid')
df = df.dropna()
# 获取时间
df['time'] = [int(i.split(' ')[1].split(':')[0]) for i in df['date']]

# 分组汇总
date_message = df.groupby(['time'])
date_com = date_message['time'].agg(['count'])
date_com.reset_index(inplace=True)

# 绘制走势图
attr = date_com['time']
v1 = date_com['count']
line = Line("歌曲被爆抄袭后-评论的时间分布", title_pos='center', title_top='18', width=800, height=400)
line.add("", attr, v1, is_smooth=True, is_fill=True, area_color="#000", is_xaxislabel_align=True, xaxis_min="dataMin", area_opacity=0.3, mark_point=["max"], mark_point_symbol="pin", mark_point_symbolsize=55)
line.render("歌曲被爆抄袭后-评论的时间分布.html")

运行之后，得到的效果图如下所示：