朴素贝叶斯分类器（带数学推导）

最新推荐文章于 2022-10-15 21:41:00 发布

机器学习我来学

最新推荐文章于 2022-10-15 21:41:00 发布

阅读量1k

点赞数 1

分类专栏：模式识别与机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lyp82nlf666/article/details/118342240

版权

模式识别与机器学习专栏收录该内容

9 篇文章 4 订阅

订阅专栏

贝叶斯分类器

最小错误率决策

基于先验知识求解后验分类器

 两类问题：ω1和ω2

 先验概率：P(ω1) 和P(ω2)

 类概率密度函数：p(x|ω1) 和p(x|ω2)

 发生了一个随机事件，其观察值为：特征向量x

 求最小错误率分类器

决策规则：比较后验概率，取最大值进行类别判断，
在这里插入图片描述
决策规则一：比较分子 p(x|ω1)P(ω1) 和 p(x|ω2)P(ω2) ，取最大值

决策规则二：似然比

决策规则二：负对数似然比

最小错误率贝叶斯决策的特点

 已知条件多——各类概率分布

 最小错误率——概率意义上最优

 非线性分类器

 设计过程复杂（类概率密度函数）

最小风险贝叶斯决策

当决策带来不必要的风险时，就必须考虑降低决策的风险，定义决策与决策空间，定义损失函数，使用期望风险最小的类别作为决策结果。

已知条件：
在这里插入图片描述
期望风险求解并取min：

一般的，最小错误率贝叶斯决策等价于0-1损失函数的最小风险贝叶斯决策。

最小风险贝叶斯决策的特点

 已知条件多——各类概率分布及风险系数

 最小错误风险——概率意义上最优

 非线性分类器

 设计过程复杂

正态分布下的贝叶斯分类器设计

多元正态分布：
在这里插入图片描述
假设类条件概率符合二维正态分布，也就是P(x∣wi)

取对数并舍去无关项 −d/2ln2π 有：

则判别函数与分类决策边界为：

考虑一般情况，每一个样本的协方差矩阵都相等，类内各个特征维度间相互独立，且方差相同，但是先验概率不同：

则得到线性判别形式的判别函数：
在这里插入图片描述
决策边界为：

可以看出在这种特定的条件下，贝叶斯分类器属于线性分类器。

贝叶斯错误率计算

1.按理论公式求解

2.按错误率上界求解

3.实验估计错误率

（半）朴素贝叶斯分类器与贝叶斯网络

在使用贝叶斯决策时，有两个条件必须是已知的：

1.各种样本出现的整体先验概率
2.各类中取得特征空间中某个点的类条件概率

先验概率可以从大量数据统计中得到，类条件概率需要从数据统计中估计，根据某一类的样本在各个维度上的特征值来估计其概率分布情况。这个概率分布，是一个各个特征维度上的联合概率分布，如果各个维度不独立，则估计很困难。

所以做“属性条件独立性假设”，各个特征相互独立，这时叫朴素贝叶斯分类器。

如果对假设做一点放松，假设每个属性在类别之外最多仅依赖一个其他属性（父属性），就叫做半朴素贝叶斯分类器。

如果利用有向无环图刻画属性之间的依赖关系，使用条件概率表（离散属性）或条件概率密度函数（连续属性）表述属性的联合概率分布，就可以有效表达属性间的条件独立性，这时就叫做贝叶斯网络，求解贝叶斯网络时，要通过评分函数评估贝叶斯网络与训练数据的契合程度。

机器学习我来学

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
朴素贝叶斯分类器（带数学推导）

贝叶斯分类器最小错误率决策基于先验知识求解后验分类器 两类问题：ω1和ω2 先验概率：P(ω1) 和P(ω2) 类概率密度函数：p(x|ω1) 和p(x|ω2) 发生了一个随机事件，其观察值为：特征向量x 求最小错误率分类器决策规则：比较后验概率，取最大值进行类别判断，决策规则一：比较分子 p(x|ω1)P(ω1) 和 p(x|ω2)P(ω2) ，取最大值决策规则二：似然比决策规则二：负对数似然比最小错误率贝叶斯决策的特点 已知条件多——各类概率分布 最小错误率—
复制链接

扫一扫

专栏目录

机器学习我来学 CSDN认证博客专家 CSDN认证企业博客

码龄5年

21: 原创

54万+: 周排名

22万+: 总排名

3万+: 访问

: 等级

314: 积分

21: 粉丝

44: 获赞

6: 评论

337: 收藏

私信

关注

热门文章

分类专栏

最新评论

SAR舰船检测数据集总结
机器学习我来学: 朋友们，我放在文中的都是官网链接哈，自己去官网就可以下载了，有的百度网盘链接的提取码在那个链接的最后几个字母！
SAR舰船检测数据集总结
有荣与焉: 你好，博主。提取码都是多少呀
SAR舰船检测数据集总结
2301_76888973: 为什么都没有提取码
GRNet 论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。
整理在windows系统上运行GRNet源码时遇到的问题以及解决方法
qq_28816805: 请问“bits/stdc++.h”的缺失您是怎么解决的？bits文件夹放到哪里好像都不对。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。