python实现中文情感分析与可视化

该博客介绍了如何使用Python进行中文情感分析,包括结巴分词、词云图绘制,通过SnowNLP和字典两种方法计算情感得分,并展示了数据可视化,如情感得分条形图和相关系数热力图。
摘要由CSDN通过智能技术生成

 

目录

一、导入原始数据

 二、结巴分词/绘制词云图

 三、计算情感值,情感分析

         # 方法一、SnowNLP计算情感得分

# 方法二、使用字典计算情感得分

 四、# 数据可视化展示

五、绘制相关系数热力图 


一、导入原始数据

#导入模块
import pandas as pd 
import numpy as np 
from collections import defaultdict
import os
import re
import jieba
import codecs
data=pd.read_csv("earphone_sentiment.csv",encoding='gbk')
data.head()
content_id content subject sentiment_word sentiment_value
0 0 Silent Angel期待您的光临,共赏美好的声音! 其他 1
1 2 这只HD650在1k的失真左声道是右声道的6倍左右,也超出官方规格参数范围(0.05%),看... 其他 NaN 0
2 3 达音科 17周年 倒是数据最好看,而且便宜 配置 1
3 4 bose,beats,apple的消費者根本不知道有曲線的存在 其他 NaN 0
4 5 不错的数据 配置 不错 1
#数据分组
s1=data[data['sentiment_value'].values==1]
s2=data[data['sentiment_value']==0]
s3=data[data['sentiment_value']==-1]
print(s3['content'])                    #输出其中一组数据
33       支持斑竹,标题不明了的话,有的时候根本就懒得进去看,起码我是这样的,别人我就不知道啦,呵呵~...
118                                                没有拜亚,差评
129      都有GDX2了,用PC直连的话,音源的质量堪忧,建议加USB隔离,比界面的效果明显多了,毕竟...
131                                                     蛋疼
142      这是我第一只大耳机不过不知道真货什么声,我是20买的仿货。仿货低频混沌但有魔幻风格,有包围感...
                               ...                        
16994    搓了根三芯卡侬母转四芯卡侬母的线接解码屁股,直接推耳机。发现没有耳放动态确实弱了不少,别的倒...
17020                                    差距很大,前提是你的系统揭示力足够
17057                                               大小差这么多
17080                 差距最明显的20hz低频也不过和原始数据相差2db左右,不值得大惊小怪。
17168                    我8005接s7都没觉得比自带耳机口差……最多就是提升不明显罢了。
Name: content, Length: 590, dtype: object

 二、结巴分词/绘制词云图

with open('stop_word/HGD_StopWords.txt','r',encoding='utf-8') as f:
    stopwords=set([line.replace('\n','')for line in f])
f.close()
#加载用户自定义词典
segs=data['content']
def clean_data(content):
    words =' '
    for seg_text in content:
        seg_text=jieba.cut(seg_text)
        for seg in seg_text:
            if seg not in stopwords and seg!=" " and len(seg)!=1:    # #文本清洗  
                  words = words +  seg + ' '
    return words
print(clean_data(s1['content']))

Silent Angel 期待 光临 共赏 美好 声音 达音科 17 周年 数据 好看 便宜 不错 数据 觉得 器材 级别 搭配 达到 线材 区别 一件 非常容易 事情 网页 手机 无法 退到 一层 希望 做好 版块 名称 显示 不全 问题 提交 软件 开发商 估计 还要 时间 入门 贴子 几个 不太 系统 建议 近期 整理 找些 资料 新手 东西 温故 可知 不错 DD 支持 顶一下 东西 树莓 能响 想出 好声 ZEN 比较 升级 直接 加个 can 就行 感受 解码 前级 PS1200 1200 解码 细节 拉满 声部 互无 关联 放到 前级 知道 前级 声音 影响 比较 比较 反正 声音 起来 目前 解码 机器 店家 所谓 国产 发烧 喜好 低端 耳机 建议 买太多 早晚 T1 800S 老路 参数 感有 很大 关系 是否 好听 绝对 关系 高价 名机 参数 就行了 参数 太低 考虑 参数 前排 好听 参数 前排 好听 我用 诗德 声音 不错 喜好 现在 看起来 简单 器材 好不好 感觉 参数 好坏 算了 最近 鼓吹 参数 绝口不提 起来 搞乱 思路 怀疑 这种 参数 图个 器材 离开 测试 仪器 分辨 能力 家里 零火 反接 最好 电笔 段时间 着迷 电源 补习 电源 相位 知识 插头 仔细检查 安置 治好 多年 颈椎病 推好 T1 低音 下潜 极深 类似 进口 12 喇叭 那种 低音 暗流 涌动 极其 凶狠 非常 过瘾 T1 音场 人声 HD800 还远 觉得 人声 声场 宽深 推力 没有 声场 推开 二狗 气质 中国 牌子 中国 产品 英文名 中文名 巴不得 消费者 白皮 私生子 百多年 西崽 气质 下贱 港灿绿蛙 引以为荣 大陆 不绝 久居 鲍鱼之肆 不觉 其臭 白灯 监听 模式 解析 最好 耐听 绿灯 hifi 模式 乐感 黄灯 暖糊 模式 人声 颗粒感 红灯 甜润 模式 人声 润喉 味道 四种 模式 高频 依次 削减 qutest 本来 高频 最后 觉得 红灯 模式 最耐 隔离 牛不香 难看 界面 更好 值不值 男儿 当自强 林子祥 还好 平板 好听 自然 高敏 失真 失真 难听 厂家 早就 秘密 烧友 se v4 韭菜 故障率 高品 控差 更是 老生常谈 只能 烧友 早就 忍受着 还要 平板 这么回事 明白 深思 真的 好事 真实性 需要 验证 老铁 耳放 看来 不错 ADX5000 外观 质感 喜欢 明显 精工细作 感觉 档次 听过 800 800s 反正 编制 确实 流行 摇滚 不行 很想 听听 大乌 好文 支持 看来 官放才 归宿 知道 官放 音色 KT 好想断 货挺 本来 打算 没货 知道 声音 翻车 现在 不太能 受得了 刺激 声音 AWKT 知道 跳水 价格 8K 暂时 好像 不太可能 缺货 厉害 西装 5000ANV 真的 甜润 5000ANV 七八年 这放 对付 低阻 耳机 铁家 木碗 真的 一套 W1000Z 中频 味道 插上 5000ANV 中频 立马 味道 不错 手上 木碗 翻车 知道 AWKT 界面 时钟 高级 系统 需要 东西 最近 intona 只能 特定 曲目 曲目 副作用 十几年 耳机 没耳放 短暂 拥有 推不开 可惜 现在 买不起 AKG 经典 监听 耳机 到家 翻出 已久 240DF 细细 真是 不错 觉得 出彩 音量 开得 保守 t1 三代 这种 精致 声场 风格 T1 一代 横向 声音 相对 较为 纵深 比较 T1 三代 印象 一句 LZ 搭配 组合 本身 偏向 天龙 耳机 T1 三代 友好 马兰士 天龙 耳机 一家亲 T1 三代 现在 看到 失真 瀑布 测量 好奇 建议 购买 一台 mbl 5010c 前级 老牌子 前级 放大器 耳机 耳机 相当 水准 音源 建议 传统 cd lp 农村 弄个 复读机 原配 耳塞 买点 盗版 磁带 听得 舒服 初中 县城 上学 有个 同学 家庭 条件 那种 比较 磁带机 森海 px80 几百 一套 说白了 那句话 没有 没有 伤害 知道 坐井观天 中学 30 50 巨款 上学 那会 hd650 dt880 大耳 觉得 超级 好几千 耳放 一笔 大钱 用家 帮顶 赞同 楼主 听感 GL1000C 真的 吃惊 耳机 封闭 耳机 自然 开阔 声场 古典 编制 音乐 时有 辉煌 堂音 堪称 古典音乐 神器 性价比 真是 挺强 价位 唯一 重量 试一试 重量轻 GL1000 GL1000C 便携 相当 不错 流云 兄好文 支持 玩过 一段时间 a6t 感觉 特色 态度 诚恳 审美 品位 审美 相对 平庸 国货 总体 说得过去 相比 高级 a8 差距 现在 见到 sxt1se 真是 耳罩 保养 习惯 器材 声音 帮顶 同意 凤凰 观点 界面 光纤 理论 高度 实际效果 现在 好像 6.35 4.4 楼主 拿下 最牛 1w5 附近 XLR 4.4 过度 时代 XLR 4.4 全送 A1000 低频 确实 厚度 结像 纤细 现在 推着 800S NIAO 低频 不错 类型 相比之下 生硬 柔和 底气 动态 夸张 有点 用力 过头 感觉 niao 耳放 很强 单个 t1 HD800 问题 追求 极致 niao 万元 m9 不错 买过 咸鱼 嫌弃 声底 清晰 微暖 gax evo 好奇 凯音 idac6 二代 9028 芯片 唯芯论 没见 有人 感觉 耳机 音乐 带入 细节 有时候 不好 he1 细节 没多 爆炸 异常 自然 好比 音频 鸟叫声 惊到 耳机 下世纪 格雷 dsd1024 解码 信息量 爆棚 信息量 解码 更好 音箱 来讲 音箱 想做到 这种 沉浸 听感 最少 需要 单独 听音 隔音 合理布局 起码 一步 几万 下不来 箱子 低频 推好 需要 功夫 几个 钉子 影响 效果 绝对 耳机 场景 或许 更广 只不过 耳机 hd800 水准 提升 较为 困难 macmini 电加 12v 10a 线电 roon hqplayer 播放 hdd 里面 音乐 万元 以内 个数 秒杀 注意 秒杀 万元 不好 roon 确实 方便 手机 控制 界面 非常 赏心悦目 不太多 pontus 挺不错 预算 建议 直接 终结者 提升 很大 耳房 实在 得换 麻烦 推荐 耳房 耳机 预算 二手 超过 1w 能少点 更好 大耳 低音 只会 更好 震撼 身上 每个 细胞 跃动 起来 几百元 入耳 战悚 感觉 说明 耳朵 满足 来看 kk 真的 好听 楼主 运气 不错 用过 1800 001 002 一两个 型号 挺不错 重量 500 舒适 400 受不了 颜色 不错 国货 国外 照样 代工 贴牌 垃圾 看起来 很火 东西 男人 国产 文案 期望值 平板 强于 动圈 习惯 动圈 耳朵 能否 接受 声音 平板 低音 不太好 有量 没质 下潜 低音 比较 混和糊 缺乏 低音 精确 描绘 速度 力量感 
  • 56
    点赞
  • 614
    收藏
    觉得还不错? 一键收藏
  • 23
    评论
词云可视化是一种非常漂亮的数据展示方式,通过词云可以将文本中的关键词以视觉的方式呈现出来。在Python中,有一个非常流行的第三方库叫做wordcloud可以用来生成词云图。你可以使用简短的几行代码就能够实现词云可视化。 词云可视化的好处在于,它可以帮助我们直观地了解文本中的关键词和频率,从而更好地理解和分析文本内容。它可以用于文本挖掘、情感分析、主题分析等各种应用场景。 对于编程新手来说,学会使用Python进行词云可视化可以是一个很好的入门项目。你可以学会如何处理文本、中文分词以及通过词云图展示文本中的关键词。对于有经验的编程专家来说,词云可视化可以帮助他们进一步熟悉Python的开源社区和计算生态,同时也可以通过自定义词云的样式和参数来展示个人风格。 总结来说,词云可视化是一种强大而美观的数据展示方式,在Python中使用wordcloud库可以轻松实现。它可以帮助我们更好地理解和分析文本内容,同时也是学习Python和文本处理的一个很好的入门项目。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [词云可视化:四行Python代码轻松上手到精通](https://blog.csdn.net/qq_41822781/article/details/90671050)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [用 Python 实现词云可视化](https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/104604193)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 23
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值