周志华《机器学习》同步学习笔记 ——第七章贝叶斯分类器

最新推荐文章于 2024-07-29 17:51:35 发布

克小洛

最新推荐文章于 2024-07-29 17:51:35 发布

阅读量626

点赞数

分类专栏：机器学习人工智能学习笔记文章标签：机器学习人工智能学习笔记贝叶斯分类器 ai

本文链接：https://blog.csdn.net/u014157256/article/details/96904918

版权

学习笔记同时被 3 个专栏收录

10 篇文章

订阅专栏

人工智能

7 篇文章

订阅专栏

机器学习

6 篇文章

订阅专栏

本文详细介绍了贝叶斯分类器的各种类型及其应用。包括贝叶斯决策论的基础概念，极大似然估计方法，朴素贝叶斯分类器的工作原理及拉普拉斯修正，半朴素贝叶斯分类器的改进思路，贝叶斯网的结构学习和推断过程，以及EM算法在参数估计中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

~~最近白天学车晚上看书我瑞了（概率论还没看啊啊啊啊）~~

7.1 贝叶斯决策论

对于分类任务，贝叶斯决策论考虑基于相关概率和误判损失来选择最优的类别标记。
期望损失（条件风险）：
在这里插入图片描述
$\lambda _{ij}$ 是将cj的样本记为ci的损失。
目标是要最小化总体风险，那么只要对每个样本最小化条件风险 $R\left (c\mid \boldsymbol{x}\right )$ 即可。

当目标为最小化分类错误率， $\lambda _{ij}$ 可为：当相同时为0，不同为1
此时条件风险变为 $R\left (c\mid \boldsymbol{x}\right )=1-P\left (c\mid \boldsymbol{x}\right )$ 即目标为最大化后验概率P。
为估计后验概率：

建模 $P\left (c\mid \boldsymbol{x}\right )$ -------判别式模型：决策树、BP、支持向量机等
对联合概率 $P\left (c,\boldsymbol{x}\right )$ 建模-------生成式模型：考虑
P(x)可以省略，因为我们比较的时候 $P(\boldsymbol x)$ 一定是相同的，所以我们就是用历史数据计算出 $P (c)$ ——用各类样本出现频率来估计和 $P(\boldsymbol x|c)$ ——下文方法。

7.2 极大似然估计

可以使条件概率估计变得简单，但严重依赖假设的概率分布是否符合潜在真实数据分布。（玄学可能失败）

估计类条件概率的基本策略：先假定其有某种确定的概率分布再用样本估计其分布的参数。根据频率主义，参数虽未知，但客观存在。极大似然估计是根据数据采样来进行估计：去寻找能最大化似然的参数值 $\mathbf{\hat{\theta }_{c}}$ ——找到一个使数据出现的可能性的最大的值
直接似然和对数似然：
在这里插入图片描述

例子 : ~~看不懂啊啊啊啊啊~~