Python弹幕情感分析之《我就是演员》

风度翩翩猪肉王子

于 2018-12-10 20:01:39 发布

阅读量3k

点赞数 1

分类专栏： Data Analysis with Python 文章标签： sentiment analysis

本文链接：https://blog.csdn.net/qq_17249717/article/details/84945428

版权

本文介绍了使用Python进行《我就是演员》节目弹幕的情感分析过程，揭示观众情绪趋势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

当我们爬取了弹幕内容后，我们进行简单的情感分析。

import pandas as pd
import jieba
from matplotlib import pyplot as plt
import matplotlib as mpl

mpl.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体 SimHei为黑体
mpl.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

# 加载自定义的词典
jieba.load_userdict('stopwords.txt')
jieba.add_word('韩雪')
jieba.add_word('张钧甯')
jieba.add_word('不用猜')
jieba.add_word('不用想')

pd.set_option('display.max_columns', None)  # pandas在pycharm中显示所有列
data = pd.read_csv('actor_danmu.csv', header=None, names=['id', '点赞数', 'Comment'])  # 设置列名
comment = list(data['Comment'])  # 提取某一列数据，将pandas对象转换为列表

def sent2word(sentence):
    # 分词，并去除停用词
    segList = jieba.cut(sentence, cut_all=False)  # 分词
    segResult = []
    for w in segList:
        segResult.append(w)
    stopwords = open('stopwords.txt', en

最低0.47元/天解锁文章