朴素贝叶斯（二）模型、推导、拉普拉斯平滑

最新推荐文章于 2022-01-30 21:48:03 发布

Foina数据分析狮

最新推荐文章于 2022-01-30 21:48:03 发布

阅读量492

点赞数 1

分类专栏：机器学习文章标签：朴素贝叶斯拉普拉斯平滑

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoxiaoliluo917/article/details/103037466

版权

本文详细介绍了朴素贝叶斯模型，包括模型定义、贝叶斯定理、条件独立假设及其优缺点。讨论了先验概率、条件概率的极大似然估计，并提出了拉普拉斯平滑来解决训练集中属性值与类别未同时出现的问题，以避免概率为0的情况。

摘要由CSDN通过智能技术生成

1 朴素贝叶斯模型

定义：基于贝叶斯定理和特征条件独立假设的分类方法。
- 贝叶斯定理（可以参考我的上篇文章朴素贝叶斯（一）知识准备—条件概率、全概率、贝叶斯公式）
- 条件独立假设—后面会介绍
贝叶斯模型是通过训练集学习联合分布P（X,Y），从而进一步求解后验概率P（Y | X）
- 贝叶斯模型是生成模型。

下面我们先来看变量表示

变量表示
- 输入变量表示为X–m维向量的集合(m个特征);
- 输出空间为类标记集合表示为 $Y=\{c_1.c_2,...,c_K\}$ ;
- 训练集为 ${(x_1,y_1).(x_2,y_2),...,(x_n,y_n)\}$ (n个样本)，特征向量 $x_i$ (第i个样本)可以表示为 $x_i=(x_i^1,x_i^2,...,x_i^m)^T$ ，其中 $x_i^j$ 表示为第i个输入变量的第j个特征。

接着介绍几个概念。

先验概率分布
$P(Y=c_k),k=1,2,...,K$
条件概率分布
$P(X=x|Y=c_k)=P(X^1=x^1,X^2=x^2,...,X^m=x^m|Y=c_k),k=1,2,...,K$

最低0.47元/天解锁文章

Foina数据分析狮

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。