大数据入门——新闻文本数据类别预测（朴素贝叶斯分类器）

ykycode

已于 2023-12-03 18:46:09 修改

阅读量1k

点赞数

分类专栏：大数据竞赛文章标签：大数据竞赛朴素贝叶斯概率算法算法类别预测

于 2017-10-10 14:20:09 首次发布

本文链接：https://blog.csdn.net/u012181348/article/details/78192132

版权

大数据竞赛专栏收录该内容

5 篇文章 0 订阅

订阅专栏

#读取数据细节
from sklearn.datasets import fetch_20newsgroups

news=fetch_20newsgroups(subset='all')
print(len(news.data))
print(news.data[0])


#数据分割
from sklearn.cross_validation import train_test_split

X_train, X_test, y_train, y_test=train_test_split(news.data, news.target,
test_size=0.25, random_state=33)


#使用朴素贝叶斯分类器进行类别预测
from sklearn.feature_extraction.text import CountVectorizer

vec=CountVectorizer()
X_train=vec.fit_transform(X_train)
X_test=vec.transform(X_test)

from sklearn.naive_bayes import MultinomialNB

mnb=MultinomialNB()
mnb.fit(X_train, y_train)
y_predict=mnb.predict(X_test)


#对朴素贝叶斯分类器的表现性能进行评估
from sklearn.metrics import classification_report
 
print('The accuracy of Naive Bayes Classifier is', mnb.score(X_test, y_test))
print(classification_report(y_test, y_predict, target_names=news.target_names))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ykycode

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
2
评论
大数据入门——新闻文本数据类别预测（朴素贝叶斯分类器）

#读取数据细节from sklearn.datasets import fetch_20newsgroupsnews=fetch_20newsgroups(subset='all')print(len(news.data))print(news.data[0])#数据分割from sklearn.cross_validation import train_test_split
复制链接

扫一扫