贝叶斯分类器

最新推荐文章于 2020-02-28 00:35:56 发布

weixin_43545898

最新推荐文章于 2020-02-28 00:35:56 发布

阅读量102

点赞数

分类专栏：笔记文章标签：贝叶斯优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43545898/article/details/102947941

版权

笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1.贝叶斯决策论

在所有相关概率都已知的情况下，对每个样本 $x$ ，选择能使后验概率 $P (c ∣ x)$ 最大的类别标记。要从训练集中估计出后验概率，两个办法：1.判别式模型：通过给定数据，直接建模 $P (c ∣ x)$ 预测 $c$ 。2.生成式模型：先对联合概率 $P (x, c)$ 建模,再通过 $P (c ∣ x) = P (x, c) / P (x)$ 计算。但是求P(x,c)很困难，难以从有限样本中得到，不符合大数定理。

下面三种方法都是为了求解P(x,c)，但是区别在于假设条件不同。极大似然假设类条件概率具有某种概率分布形式，需要自定义；朴素贝叶斯假设所有属性相互独立；半朴素贝叶斯假设每种属性最多依赖一个其它属性。

2.极大似然估计

假定类条件概率具有某种概率分布形式，再根据训练样本对概率分布函数进行估计。同时假设其具有确定形式且只被参数向量 $\theta_c$ 唯一确定.

对数似然： $LL(\theta_c)=logP(D_c|\theta_c)=\sum_{x\in D_C}{logP(x|\theta_c)}$ ,找出使之最大的 $\theta_c$ 即可。（假设 $\theta_c$ 是定值）

3.朴素贝叶斯分类器

假设所有属性相互独立，分类器表达式： $h_{nb}=max P(c)\prod_{i=1}^{d}P(x_i|c)$

但问题在于若某属性没有数据，则 $\prod_{i=1}^{d}P(x_i|c)$ 将等于0，抹杀正确答案，所以使用拉普拉斯修正：

$P(c)=\frac{|D_c|+1}{|D|+N}$

$P(x_i|c)=\frac{|D_{c,x_i}|+1}{|D_c|+N_i}$

4.半朴素贝叶斯分类器

假设每种属性最多依赖一个其它属性

$h_{nb}\propto P(c)\prod_{i=1}^{d}P(x_i|c,pa_i)$

确定相关属性最直接的办法是直接设依赖于同一个属性，为“超父”；或者在最大生成树算法基础上将依赖关系简化为树形结构。

若假设依赖属性不止一个，如果训练数据非常充分泛化性有所提升；否则会陷入高阶联合概率的困难中。

weixin_43545898

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯分类器

1.贝叶斯决策论在所有相关概率都已知的情况下，对每个样本xxx，选择能使后验概率P(c∣x)P(c|x)P(c∣x)最大的类别标记。要从训练集中估计出后验概率，两个办法：1.判别式模型：通过给定数据，直接建模P(c∣x)P(c|x)P(c∣x)预测ccc。2.生成式模型：先对联合概率P(x,c)P(x,c)P(x,c)建模,再通过P(c∣x)=P(x,c)/P(x)P(...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。