关于贝叶斯的一些个人理解

最新推荐文章于 2024-03-05 13:36:06 发布

ffffffffjy

最新推荐文章于 2024-03-05 13:36:06 发布

阅读量267

点赞数

分类专栏：个人理解文章标签：贝叶斯机器学习西瓜书个人理解新手求改正

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43399955/article/details/83685109

版权

个人理解专栏收录该内容

3 篇文章 1 订阅

订阅专栏

关于贝叶斯分类器的一些理解

参考西瓜书及一些论坛资料

首先明白咱们用贝叶斯***分类***器想干什么：

例如：有一个细胞切片，通过收集样本，得到一些良性细胞的特征和恶心细胞的特征。这时如果出现了一个新的细胞，我们希望可以通过从这个新细胞上面得到一些特征来判断这个细胞是什么性质的细胞。

故，贝叶斯主要用于离散分类任务。

贝叶斯定理：P（c｜x）=【P（c）P（x｜c）】/P（x）

P（c）是先验概率，可以通过样本集求出。P（x）是证据。所以问题的关键变成了***求P（x｜c）***上

总体决策思想：1、基于最小错误率的贝叶斯决策。2、基于最小风险的贝叶斯决策

参考：https://blog.csdn.net/songzitea/article/details/23131609

因为对于类条件概率P（x｜c）来说，由于它涉及关于x所有属性的联合概率，直接根据样本出现的频率来估计将会遇到严重的困难。比如，有五个西瓜作为样本｛12345｝。其中有一个特征是色泽，观察五个样本的色泽发现，样本123的色泽是青绿色且都是好瓜。但是能根据这就说P（色泽=青绿｜好瓜=是）=1么？显然是不对的。因为“未被观测到”和“出现概率为零”显然是不同的。

具体计算P（x｜c）的方法：

1.极大似然估计

当P（x｜c）仅被参数向量θc唯一确定。比如，正常情况下，某个瓜是否是好瓜可能由多个特征决定，比如色泽，根蒂etc。但是我们假设，某类瓜的某个特征仅有色泽决定。故P（x｜c）也可以写成P（x｜θc）。这时可用极大似然估计来估计θc，故而求出P（x｜c），比方说我想求P（敲声=闷响，根蒂=卷曲｜好瓜=是）=？。我们就可以等价于求P（敲声=闷响，根蒂=卷曲｜色泽=青绿）的概率。

公式参考西瓜书149页。

书中对连续回归问题也有介绍。

2.朴素贝叶斯分类器

和极大似然估计不同，因为现实生活中P（x｜c）很少仅由一个参数向量决定，例如，色泽=青绿的瓜就能决定这个瓜的根蒂？显然不对。所以引入朴素贝叶斯分类器。

朴素贝叶斯分类器虽然更贴近实际，但是它假设了
1.每种特征相互独立即互不影响
2.特征对结果的影响是相同的。
比如，下雨不影响刮风，下雨对出去玩的影响和刮风对出去玩的影响是相同的。

西瓜书上的例子很详细。

注意拉普拉斯修正。

这里应该注意在书上153页的例子上的公式7.19中，N是种类c有几种，例如书中84页表中，瓜可分好瓜和坏瓜，这里的N=2。公式7.20中，Ni是指特征X有几种，同样的例子中，色泽有三种，则取值为3。

3.半朴素贝叶斯分类器。

朴素贝叶斯分类器中的独立这个假设在现实生活中很难实现。故引入半朴素贝叶斯分类器。

当每种特征仅依赖除自己之外的最多一种特征，则有ODE（独依赖估计），分为SPODE和AODE，AODE就是SPODE加个外循环，和TAN算法。

TAN算法是以最大生成树为基础的算法。树上有例题。最大生成树我感觉kruskal最好理解。

4.贝叶斯网

当属性之间不满足仅依赖一个的时候，即有了贝叶斯网。

贝叶斯网分为三小节：（1）如何判断属性之间的依赖关系。（2）如何编织贝叶斯网。（score function）（3）通过贝叶斯网来直接求取P（Q｜E）也就是说不用求P（x｜c）。（这里的两种算法：吉布斯和EM还不是很懂。）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于贝叶斯的一些个人理解

关于贝叶斯分类器的一些理解参考西瓜书及一些论坛资料首先明白咱们用贝叶斯***分类***器想干什么：例如：有一个细胞切片，通过收集样本，得到一些良性细胞的特征和恶心细胞的特征。这时如果出现了一个新的细胞，我们希望可以通过从这个新细胞上面得到一些特征来判断这个细胞是什么性质的细胞。故，贝叶斯主要用于离散分类任务。贝叶斯定理：P（c｜x）=【P（c）P（x｜c）】/P（x）P（c）是先验概率...
复制链接

扫一扫

专栏目录

ffffffffjy CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

107万+: 周排名

123万+: 总排名

1万+: 访问

: 等级

125: 积分

5: 粉丝

11: 获赞

7: 评论

36: 收藏

私信

关注

热门文章

分类专栏

配置深度学习环境过程记录 5篇
个人理解 3篇

最新评论

神经网络参数梯度为None
Jack.Du: y = self.g(x) f = self.g(y) y.requires_grad = True y.retain_grad() f.backward(f.clone().detach().requires_grad_(True), retain_graph=True) print(y.grad) 您好请问这种情况下也是none有解决方法吗？
神经网络参数梯度为None
叼辣条闯天涯: 还有一种原因是，不要在forward中把tensor类型的数据转换成float等基础类型存储，因为tensor对象里边有存梯度的属性，转换之后会被直接丢弃，导致后续所有的梯度值为None
Ubuntu20.04安装CUDA10.0
绯雨千叶: 20.04装不了CUDA10.0
神经网络参数梯度为None
laidone: 网络参数为none，你倒是返回网络参数啊，你这是什么？你这是自定义的参数，乱起标题
maskrcnn-benchmark安装过程
weixin_42761416: 大佬您好，我在安装编译其他模型的时候遇到了Error compiling objects for extension的报错，考虑到可能也是这个问题，请问如果我不是用maskrcnn，我应该怎么修改cuda_dir呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。