机器学习——入门基础（贝叶斯分类器）

最新推荐文章于 2024-05-15 05:49:26 发布

友培

最新推荐文章于 2024-05-15 05:49:26 发布

阅读量867

点赞数 2

分类专栏：大数据——机器学习文章标签：机器学习概率论分类朴素贝叶斯算法贝叶斯

本文链接：https://blog.csdn.net/xiaoyoupei/article/details/122641753

版权

大数据——机器学习专栏收录该内容

12 篇文章 4 订阅

订阅专栏

文章目录

贝叶斯定理

引言

传送门，讲解到位：https://www.matongxue.com/madocs/279

考虑这样一种情况

事件A和事件B发生有交集(这里可以用集合概念)

那必然有一个条件概率的公式，在A事件发生下，B事件发生的概率：P(B|A) = P(AnB) / P(A)，这其实很好理解，用面积的知识，发生A事件的概率面积作为分母，A和B相交的事件概率作为分子，这就求出了A事件发生情况下，B事件发生的概率

下面这个公式很好推导，也就是P(B|A) = P(AnB) / P(A)和 P(A|B) = P(BnA) / P(B)，就可算得

朴素贝叶斯分类算法核心就是上述理论公式转换如下，注意这个式子是需要假设各个特征之间相互独立,特征之间不会产生影响

preview

重新理解最大似然估计

传送门，讲解到位：https://www.matongxue.com/madocs/447

首先要去理解似然和概率的关系？

当我们知道某一具体事件发生的可能性，这就是概率，比如我们知道在客观情况下，硬币正反面的参数是各占0.5，所以我们在扔10次硬币的时候出现5次朝上的概率下图计算，满足二项分布：

组合数计算公式： [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LygeqmeK-1642848765031)(https://bkimg.cdn.bcebos.com/formula/80656d15eeb5e98f4c910e64b83ba6a3.svg)]

那当我们不了解这个具体参数，要通过实践才能去推测这个参数，这就是似然，相当于多次实践归纳推理，那么得到最有可能的参数也就是最大似然估计

单次实验(抛10次，出现6次花面)，我们不知道参数，那可以假设参数为0.5、0.6…，拿0.5和0.6计算，两次做比较发现0.6参数的可能性是0.5参数的1.2倍，那肯定是要选取最有可能的参数，自然就是0.6
在这里插入图片描述

那接下来，用多次实验进行最大似然估计，我们每一次实验抛10次硬币，总共进行6次实验，假设结果为{4，5，5，2，7，4}，分别是每一次实验出现花面的个数，当然每次实验是独立的，不受其他实验的干扰，再进行通式，用x1,x2…xn表示每次结果，则在同一参数下，所求的独立事件的联合概率为下图，(注意：这个参数我们并不知道),
在这里插入图片描述表示在同一个参数下的实验结果，也可以认为是条件概率
我们想求的必然是L(theta)最大值，也就是L(theta)=argmax

朴素贝叶斯

假设样本各属性条件独立，互不影响，这就是朴素贝叶斯的思想，公式就是套用了贝叶斯定理，如下图所示，P©表示样本分类的概率（西瓜举例，好瓜还是坏瓜的概率对于样本而言）,P(X|C)表示每个属性分类的概率连乘（西瓜举例，就是每个属性的好坏概率）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dmEOjaOg-1642848765034)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122145552530.png)]

那显然，P(X)都是一样的是常量，就比较关系而言可以省略，并且要求最大值，所以公式变换如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xlT1jokm-1642848765035)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122145910960.png)]

这里还要阐述下对于离散和连续值属性的处理，离散值很好解决，直接统计个数/总样本数即可，连续值要求出该属性取值的均值和方差做正态分布，具体就是西瓜书上下图所言

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hXKuWT8v-1642848765035)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122150527440.png)]

示例，比如现在来一条数据，判断好瓜还是坏瓜?

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IrdnxRnR-1642848765035)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122150552228.png)]

数据计算过程如下

在这里插入图片描述

但是我们设想这样一种，如果某个属性的分类后的概率为0（也就是该分类情况下没有该属性值的出现）？应该如何处理？

这里我们要使其平滑，常用的方法就是拉普拉斯修正，分子加1，分母为N，N表示该分类情况下该属性的次数，也就是下图公式

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7IOdGejv-1642848765036)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122151401089.png)]

半朴素贝叶斯分类器

假设每个属性在类别之外最多依赖一个其他属性，这就是ODE(独依赖估计)，其实就是把依赖的属性作为类别一起考虑，pai就是依赖属性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sndNghdx-1642848765036)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122185013455.png)]

假设所有的属性都依赖于同一个”超夫“属性，这就是SPODE(超父独依赖估计)，xi就是依赖的超父属性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GihNP9bz-1642848765036)(F:/ZNV/%E7%AC%94%E8%AE%B0%E5%9B%BE%E7%89%87/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E8%A5%BF%E7%93%9C%E4%B9%A6/image-20220122185035876.png)]

EM算法

暂时省略

类同于K-Means聚类算法的思想

传送门：https://www.bilibili.com/video/BV1i4411G7Xv?p=9&share_source=copy_web

友培

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习——入门基础（贝叶斯分类器）

文章目录贝叶斯定理重新理解最大似然估计朴素贝叶斯半朴素贝叶斯分类器EM算法贝叶斯定理引言传送门，讲解到位：https://www.matongxue.com/madocs/279考虑这样一种情况事件A和事件B发生有交集(这里可以用集合概念)那必然有一个条件概率的公式，在A事件发生下，B事件发生的概率：P(B|A) = P(AnB) / P(A)，这其实很好理解，用面积的知识，发生A事件的概率面积作为分母，A和B相交的事件概率作为分子，这就求出了A事件发生情况下，B事件发生的概率下面这个公式
复制链接

扫一扫