《Python机器学习及实践：从零开始通往Kaggle竞赛之路》第2章基础篇学习笔记（三）2.1.1.3朴素贝叶斯总结

最新推荐文章于 2024-09-03 00:09:51 发布

wyatt007

最新推荐文章于 2024-09-03 00:09:51 发布

阅读量472

点赞数 1

分类专栏： Python机器学习及实践

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wyatt007/article/details/105600788

版权

本文是《Python机器学习及实践》书中关于朴素贝叶斯的学习笔记，主要介绍了朴素贝叶斯模型的定义、数据描述，通过20类新闻文本数据进行实践操作，包括数据分割、模型训练和性能测评，结果显示朴素贝叶斯分类器在文本分类任务上表现出约84%的准确性。

摘要由CSDN通过智能技术生成

目录

2.1.1.3朴素贝叶斯

1、模型介绍

（1）朴素贝叶斯的定义

（2）朴素贝叶斯模型

2、数据描述

（1）20类新闻文本数据背景

（2）20类新闻文本数据细节

（3）20类新闻文本数据分割

3、编程实践

4、性能测评

5、特点分析

2.1.1.3朴素贝叶斯

1、模型介绍

（1）朴素贝叶斯的定义

朴素贝叶斯是一个非常简单，但是实用性很强的分类模型。不过，和两个基于线性假设的模型（线性分类器和支持向量机分类器）不同，朴素贝叶斯分类器的构造基础是贝叶斯理论。

朴素贝叶斯分类器会单独考量每一维度特征被分类的条件概率，进而综合这些概率并对其所在的特征向量做出分类预测。因此，这个模型的基本数学假设是：各个维度上的特征被分类的条件概率之间是相互独立的。

（2）朴素贝叶斯模型

如果采用概率模型来表述，则定义 $x=<x_{1},x_{2},...,x_{n}>$ 为某一n维特征向量， $y\in (c_{1},c_{2},...,c_{k})$ 为该特征向量x所有k种可能的类别，记 $P(y=c_{i}|x)$ 为特征向量x属于类别 $c_{i}$ 的概率。根据式（9）的贝叶斯原理：

$P(y|x)=\frac{P(x|y)P(y)}{P(x)}......(9)$

目标是寻找所有 $y\in (c_{1},c_{2},...,c_{k})$ 中 P(y|x) 最大的，即 $\underset{y}{argmax}P(y|x)$ ；并且考虑到 P(x) 对于同一样本都是相同的，因此可以忽略不计。所以，

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。