机器学习笔记之朴素贝叶斯

最新推荐文章于 2023-03-13 21:57:44 发布

alwaysRememberrr

最新推荐文章于 2023-03-13 21:57:44 发布

阅读量599

点赞数 1

分类专栏：机器学习基础笔记文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014046022/article/details/79950195

版权

本文详细介绍了朴素贝叶斯方法，包括其为什么被称为朴素，学习与分类的步骤，后验概率最大化的含义，以及参数估计中的极大似然估计和贝叶斯估计。通过贝叶斯定理和条件独立性假设，朴素贝叶斯简化了分类问题，但可能牺牲准确性。

摘要由CSDN通过智能技术生成

朴素贝叶斯

1 朴素贝叶斯为什么叫朴素贝叶斯？

因为这种方法是基于贝叶斯定理,顺便复习一下贝叶斯定理的表达式：

$P (B i | A) = P ( A | B i ) P ( B i ) \sum N j = 1 P ( A | B j ) P ( B j )$ $P(B_i|A) = \frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{N} P(A|B_j)P(B_j)}$
朴素贝叶斯法对条件概率分布作了条件独立性的假设，这是一个很强的假设，所以对应 “朴素” 二字。条件独立性假设 就是说用于分类的特征在类确定的条件下都是条件独立的。这个假设使得朴素贝叶斯变简单了，但也牺牲了一定的准确率， 条件独立性假设表达式：

P (X = x | Y = c k) = P (X (1) = x (1), \dots, X (n) = x n | Y = c k) = \prod j = 1 n P (X (j) = x (j) | Y = c k)

$\begin{align} P(X=x|Y=c_k) &= P(X^{(1)} = x^{(1)},\cdots,X^{(n)} = x^{n} | Y = c_k) \\ &= \prod_{j=1}^{n}P(X^{(j)} = x^{(j)}|Y=c_k) \end{align}$

2 朴素贝叶斯的学习与分类

2.1 学习方法

朴素贝叶斯法通过训练数据集学习联合概率分布 $P(X,Y)$ . 具体地：

学习先验概率分布：

$P (Y = c k), k = 1, 2, \dots, K$ $P(Y=c_k) , k = 1,2,\cdots,K$
学习条件概率分布:

$P (X = x | Y = c k) = P (X (1) = x (1), \dots, X (n) | Y = c k), k = 1, 2, \dots, K$ $P(X=x|Y=c_k) = P(X^{(1)} = x^{(1)},\cdots,X^{(n)}|Y=c_k), k = 1,2,\cdots,K$

于是学习到联合概率分布 $P(X,Y)$ 。道理简单嘛，就是根据条件概率公式：

P (A B) = P (A | B) P (B) = P (B | A) P (A)

$P(AB) = P(A|B)P(B) = P(B|A)P(A)$

2.2 分类方法

朴素贝叶斯分类时，对给定的输入 $x$ ，通过学习到模型计算后验概率分布 $P(Y=c_k|X=x)$ ，将后验概率最大的类作为 $x$ 的输出。后验概率计算根据贝叶斯定理进行：

P (Y = c k | X) = P ( X = x | Y = c k ) P ( Y = c k )

最低0.47元/天解锁文章

alwaysRememberrr

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。