西瓜书笔记——贝叶斯分类器(一)

最新推荐文章于 2023-11-04 23:12:00 发布

杰森斯坦熊

最新推荐文章于 2023-11-04 23:12:00 发布

阅读量405

点赞数 3

分类专栏：西瓜书笔记文章标签：西瓜书贝叶斯

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30335773/article/details/97115407

版权

西瓜书笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

贝叶斯分类器

贝叶斯判定准则：对每个样本x，选择能使后验概率P(c | x) 最大的类别标记

然而，在现实任务中这通常难以直接获得，所以机器学习所要实现的是基于有限训练样本集尽可能准确地估计出后验概率P(c | x)

策略通常有如下两种：
给定x，可通过直接建模P(c | x) 来预测c，这样得到的是判别式模型。（如决策树、BP神经网络、支持向量机）
也可先对联合概率分布P(c ，x) 建模，然后再由此获得P(c | x) ，这样得到的是生成式模型。

朴素贝叶斯分类器

核心思想：根据“确定分类标签的前提下，得到样本x的概率”进行判断是哪一个类。

平滑处理(smoothing)：如果训练样本中“好瓜”里没有出现“青绿瓜”，那么P(青绿|好)=0，即使其他特征都倾向于“好瓜”，那么最终的（连乘）结果也会等于0。所以需要进行平滑处理，进行拉普拉斯修正。

拉普拉斯修正：N代表一共有多少个分类，c是其中一个

$P\left ( c \right ) = \frac{\left | D_c \right |+1}{\left | D \right |+N}$

现实任务中朴素贝叶斯分类器有多种使用方式：
1.对速度有要求，预训练好然后直接查表
2.数据流动性大，进行“懒惰学习”先不进行任何训练，待收到预测请求时再根据当前数据集进行概率估值

杰森斯坦熊

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
西瓜书笔记——贝叶斯分类器(一)

贝叶斯分类器贝叶斯判定准则：对每个样本x，选择能使后验概率P(c | x) 最大的类别标记然而，在现实任务中这通常难以直接获得，所以机器学习所要实现的是基于有限训练样本集尽可能准确地估计出后验概率P(c | x)策略通常有如下两种：给定x，可通过直接建模P(c | x) 来预测c，这样得到的是判别式模型。（如决策树、BP神经网络、支持向量机）也可先对联合概率分布P(c ，x) 建模，然后...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。