统计学习方法笔记（四）

最新推荐文章于 2024-08-05 20:31:58 发布

zuxiaodon

最新推荐文章于 2024-08-05 20:31:58 发布

阅读量373

点赞数 1

分类专栏：机器学习文章标签：机器学习分类朴素贝叶斯贝叶斯估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zuxiaodon/article/details/51955411

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

朴素贝叶斯法：

前提：朴素贝叶斯法是建立在贝叶斯定理和特征条件独立假设的基础上的分类方法。

大致流程为：对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布:然后基于此模型，对给定的输入x. 利用贝叶斯定理求出后验概率最大的输出y。

说白了就是通过贝叶斯公式算出后验概率，哪个大就归为哪一类。

首先引入条件独立性假设：

正是由于这个假设，朴素贝叶斯方法实现起来非常简单，而且效率高，但是正是由于这个假设，分类准确性会受到一些影响。（这是当然的，有个这么强的假设，肯定会牺牲掉一些东西）

然后是贝叶斯公式;

将两个式子融合下就成了朴素贝叶斯法的基本公式：

而我们要求的就是上诉实在的最大值，对于各分类，分母是相同的，所以也可直接写成

在第一章中将结构风险最小化时，我们就说过，朴素贝叶斯最大后验概率就是其中一个例子。

所以朴素贝叶斯法将实例分到后验概率最大的类中，这等价于期望风险最小化。

具体证明在书上，就不写了。

从公式中我们也可以发现，分子中各部分都需要用到的都是训练数据集，也就是要用到极大似然估计，那么就有可能出现概率值为0的情况。（比如我要确定x=（1，a）的类标记，训练集中数据为（1，b，Y=1）（2，c，Y=-1），这样P(x2=a|Y=1)=0）

解决这种问题的方法是用贝叶斯估计，

当系数=1时，就是拉普拉斯平滑（。。。。我不知道在这里怎么打这个符号）

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法笔记（四）

朴素贝叶斯法：前提：朴素贝叶斯法是建立在贝叶斯定理和特征条件独立假设的基础上的分类方法。大致流程为：对于给定的训练数据集，首先基于特征条件独立假设学习输入/输出的联合概率分布:然后基于此模型，对给定的输入x. 利用贝叶斯定理求出后验概率最大的输出y。说白了就是通过贝叶斯公式算出后验概率，哪个大就归为哪一类。首先引入条件独立性假设：
复制链接

扫一扫

专栏目录

zuxiaodon CSDN认证博客专家 CSDN认证企业博客

码龄12年

6: 原创

55万+: 周排名

96万+: 总排名

9925: 访问

: 等级

182: 积分

8: 粉丝

6: 获赞

2: 评论

6: 收藏

私信

关注

热门文章

分类专栏

机器学习 5篇

最新评论

统计学习方法笔记（三）
MR_Radish666: 这是摘抄，，，书上写的内容有好多地方都不太理解，例题里面的过程太抽象了
统计学习方法笔记（三）
moses1994: 您好，我有两点疑惑，希望能与您交流，QQ：1002100760： 1、“根据x轴方向的值2,5,9,4,8,7排序选出中值为7”，2,5,9,4,8,7排序为：2 4 5 7 8 9，中位数应该是（5+7）/2=6，为什么选择的是7？ 2、右子空间包含2个节点{（9,6），（8,1）}，按照Y的排序为：1 6，中位数为（1+6）/2=3.5，为什么选择6作为根节点？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。