7、数据分析--贝叶斯案例

最新推荐文章于 2021-09-02 10:05:43 发布

T o r

最新推荐文章于 2021-09-02 10:05:43 发布

阅读量451

点赞数

文章标签： python 机器学习深度学习

本文链接：https://blog.csdn.net/qwe863226687/article/details/119052266

版权

这篇博客探讨了贝叶斯案例，通过Python进行数据预处理，包括jieba分词、停用词移除和词云生成。进一步，应用TF处理和数据降维，利用伯努利贝叶斯模型进行分析。结果显示0类别的精度显著高于-1和1类别，揭示了类别不平衡问题。提出了多项式朴素贝叶斯作为改进方案。

摘要由CSDN通过智能技术生成

贝叶斯案例

import pandas as pd
import jieba
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import TruncatedSVD
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import BernoulliNB
from sklearn.metrics import confusion_matrix, classification_report
import matplotlib.pyplot as plt
from wordcloud import WordCloud

# sheet_name 更换工作表
data = pd.read_excel('./datas/classify.xls', sheet_name='classify')
data.head()

	Announce_ID	User_Name	Topic	Body	post_type	sentiment	IP
0	319855	dingyu3749	建议打印机加装双面器，直接双面打印！

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

T o r

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
7、数据分析--贝叶斯案例

贝叶斯案例import pandas as pdimport jiebafrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.decomposition import TruncatedSVDfrom sklearn.model_selection import train_test_splitfrom sklearn.naive_bayes import BernoulliNBfrom sklearn.
复制链接

扫一扫