商品评论情感分析

WuWuWu_bug

于 2024-02-05 13:45:26 发布

阅读量499

点赞数 11

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WuWuWu_bug/article/details/136040254

版权

本文介绍了如何运用Python的sklearn库中的朴素贝叶斯方法对商品评价进行情感分析，包括数据预处理（如分词、停用词去除）、特征提取（词频统计）以及训练集和测试集的划分，最终评估模型在13条数据上的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于朴素贝叶斯公式进行商品评价情感分析

import numpy as np
import pandas as pd
import jieba
import matplotlib.pyplot as plt
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

#读入数据
data=pd.read_json("work/情感倾向.json")

# 2. 数据基本处理
#2.1 取出内容列，对数据进行分析
content = data["内容"]

# 2.2 选择停用词
# 加载停用词
stopwords = []
with open("work/停用词.txt" ,'r', encoding="utf-8") as f:
    lines = f.readlines()
    for tmp in lines:
        line = tmp.strip()
        stopwords.append(line)

# 2.3 把“内容”转换为标准格式
comment_lst = []
for tmp in content:
    print("原始数据：", tmp)
    
    # 通过结巴分词对文本数据进行切割（把一句句话变成一个个词）
    seg_lst = jieba.cut(tmp, cut_all=False)
    print("切割后的数据", seg_lst)
    
    # 拼接字符串
    seg_str = ','.join(seg_lst)  
    print("拼接后的字符串：", seg_str)
    comment_lst.append(seg_s

最低0.47元/天解锁文章

博客等级

码龄2年

41
原创

104
点赞

66
收藏

62
粉丝

关注

私信

热门文章

分类专栏

跬步 21篇

最新评论

00001
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
SSD单发多框检测——模型及其损失函数
CSDN-Ada助手: 恭喜用户发布第17篇博客！文章标题看起来非常有趣，SSD单发多框检测是一个很有挑战性的主题。建议在接下来的创作中，可以深入探讨模型的实际应用场景和性能优化方面，这样读者能够更好地理解和应用你的研究成果。期待你的下一篇博客！祝好！
R-CNN、Fast R-CNN、Faster R-CNN ——简单实现
CSDN-Ada助手: 恭喜您发布了第18篇博客“R-CNN、Fast R-CNN、Faster R-CNN ——简单实现”，内容涵盖了目前深度学习领域中的热门话题，展现了您对于这些算法的理解和实践能力。继续保持创作的热情和努力，相信您在这个领域会取得更加优秀的成就。建议您在未来的创作中，可以结合实际案例或应用场景，深入探讨算法原理和优化方法，让读者能够更加直观地理解和应用所学知识。期待您更多精彩的分享，谢谢您的辛勤付出！
SSD单发多框检测—基础结构
CSDN-Ada助手: 恭喜您发布了第16篇博客《SSD单发多框检测》，文章内容十分精彩！不断学习和分享是非常宝贵的品质，希望您能继续保持创作的热情和耐心，为读者带来更多有价值的内容。接下来，或许可以探讨一下SSD单发多框检测在实际应用中的挑战及解决方案，让读者更深入地了解这一技术。期待您的下一篇作品！祝您创作愉快！
dijkstra 最短路径
CSDN-Ada助手: 恭喜您第15篇博客《dijkstra 最短路径》发表成功！您的持续创作精神令人钦佩。希望您能继续保持写作的热情，不断探索更多有趣的主题，也许可以尝试深入探讨一些算法的实际应用或者与其他领域的结合，期待您更多精彩的作品！祝您写作顺利，加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。