sklearn 算法基础（朴素贝叶斯API，分类模型评估）

最新推荐文章于 2024-06-19 23:36:11 发布

自然color

最新推荐文章于 2024-06-19 23:36:11 发布

阅读量408

点赞数

分类专栏： Python笔记文章标签： sklearn 算法机器学习

本文链接：https://blog.csdn.net/weixin_46955575/article/details/125859035

版权

本文介绍了如何使用sklearn的朴素贝叶斯API，特别是MultinomialNB，进行了拉普拉斯平滑的说明，并通过20类新闻分类案例分析了算法的应用。同时，探讨了朴素贝叶斯算法的优缺点，如稳定分类效率、对缺失数据不敏感等。接着，文章转向分类模型评估，包括准确率、混淆矩阵和F1-score，以及使用classification_report进行模型评估。

摘要由CSDN通过智能技术生成

1.朴素贝叶斯案例

1.1防止求出的概率为0，进行拉普拉斯平滑

1.2sklearn朴素贝叶斯实现API

sklearn.naive_bayes.MultinomialNB

sklearn.naive_bayes.MultinomialNB(alpha = 1.0)

alpha：拉普拉斯平滑系数

1.3案例分析 20类新闻分类

from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.datasets import fetch_20newsgroups
from sklearn.metrics import c