朴素贝叶斯－新闻分类

最新推荐文章于 2020-12-04 09:44:50 发布

cicilover

最新推荐文章于 2020-12-04 09:44:50 发布

阅读量1.8w

点赞数 1

分类专栏： machine learning 文章标签：朴素贝叶斯 Naive Bayes NB 新闻分类

本文链接：https://blog.csdn.net/cicilover/article/details/77336337

版权

该博客介绍了使用朴素贝叶斯算法对20类新闻文本进行分类的实验。实验结果显示分类准确率为0.83977，详细展示了不同类别新闻的精确度、召回率和F1分数。朴素贝叶斯算法在新闻分类任务中表现出良好的性能。

摘要由CSDN通过智能技术生成

朴素贝叶斯分类器的构造基础是基于贝叶斯定理与特征条件独立假设的分类方法，与基于线性假设的模型（线性分类器和支持向量机分类器）不同。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型（Naive Bayesian Model，NBM）。

朴素贝叶斯有着广泛的实际应用环境，特别是在文本分类的任务中，包括新闻的分类，垃圾邮件的筛选。

下面使用经典的20类新闻文本作为试验数据：

Python源码：

#coding=utf-8
#load news data
from sklearn.datasets import fetch_20newsgroups
#-------------
from sklearn.cross_validation import train_test_split
#-------------
from sklearn.feature_extraction.text import CountVectorizer
#-------------
from sklearn.naive_bayes import MultinomialNB
#-------------
fr