[贝叶斯七]之正态分布贝叶斯决策

最新推荐文章于 2024-06-21 12:04:31 发布

背包_十年

最新推荐文章于 2024-06-21 12:04:31 发布

阅读量1w

点赞数 7

分类专栏： faicutly 机器学习文章标签：贝叶斯贝叶斯分类贝叶斯决策机器学习正态分布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/neu_chenguangq/article/details/79288905

版权

本文深入探讨了正态分布数据的贝叶斯决策理论，从单变量到多变量正态分布，解析其特点。通过理论推导，设计了一个基于最小欧式距离的贝叶斯分类器，并逐步弱化假设，引入马氏距离。文章揭示了在正态分布假设下，决策面是通过均值点连线中点的垂直线，形成了最小欧式距离分类器。

摘要由CSDN通过智能技术生成

贝叶斯是非常传统，理论简单，但是非常有效的一种机器学习方法。经过大量实验表明，贝叶斯方法是极具鲁棒性的。至今为止仍然有很多人在研究贝叶斯的基础理论，而且发现许多算法都可以由贝叶斯推导而来，所以贝叶斯是具有极大的研究价值的理论。

这一章节我们就来扯一扯正态分布数据的贝叶斯决策理论，看看我们能搞点什么事情出来。自己多多推导，没准能发现新的大陆。许多优秀的算法，比如SVM等等往往就是这样诞生的。

这一节因为推导的东西比较多，可能很枯燥。所以先搞个大纲出来，看看我们接下来要搞点什么事情。

正态分布
- 单变量正态分布
- 多变量正态分布
- 正态分布的特点
贝叶斯分类器设计
- 理论推导
- 简化case1：最小欧式距离
- 简化case2：马氏距离
- General

主要就是这样一个构架了，谈正态分布的贝叶斯决策，显然我们得谈谈正态分布，然后由此出发，我们从最简单的case(增加各种假设条件，得到一个最简单的模型)，然后依次General。

闲话少说，开始我们的旅程吧。

一、正态分布

这里不是将概率论，详情请看我们写的数学系列教程。这里我们从需求出发，简单阐述单变量正态分布、多变量正态分布，最重要的是阐述一下正态分布的特点。

1.1 单变量正态分布

首先，搞个热身运动。下面是最简单的单变量正态分布。

这里写图片描述

这里写图片描述

其中：

Pdf（单变量概率密度函数）

p (x) = 1 2 π - - \sqrt σ e {- 1 2 (x - μ σ) 2}

$p(x) = \frac {1}{\sqrt{2\pi}\sigma} e^{\{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2\}}$

Mean Vector (均值)

μ = E {x} = \int x p (x) d x

$\mu = E{\{x\}} = \int xp(x)dx$

Variance（方差）

σ 2 = E {(x - u) 2} = \int (x - μ) 2 p (x) d x

$\sigma^2 = E{\{(x-u)^2\}} = \int (x-\mu)^2p(x)dx$

数学表达式

p (x) N (μ, σ 2)

$p(x) ~ N(\mu, \sigma^2)$

1.2 多变量正态分布

这里写图片描述

多变量pdf表达

p (x) = 1 ( 2 π ) 1 / 2 | \sum | 1 / 2 exp {- 1 2 (x - μ) T \sum - 1 (x - μ)}, x \in R l

$p(x)=\frac{1}{(2\pi)^{1/2}|\sum|^{1/2}}\exp {\{-\frac{1}{2}(x-\mu)^T{\sum}^{-1}(x-\mu)\}}, \quad x \in R^l$

Mean Vector（均值）

μ = E [x] = E [x 1, x 2, . . . . ., x l]

$\mu = E[x] = E[x_1,x_2,.....,x_l]$

Convariance matrix (协方差矩阵)

\sum = E [(x - μ) (x - μ) T] (1)

$\begin{align} \sum &= E[(x-\mu)(x-\mu)^T]\\ \end{align}$

= ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ σ 211 σ 221 ⋮ σ 2 l 1 σ 212 σ 222 ⋮ σ 2 l 2 \dots \dots ⋱ \dots σ 2 1 l σ 2 2 l ⋮ σ 2 l l ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

$= \begin{bmatrix} \sigma_{11}^2 & \sigma_{12}^2 & \cdots & \sigma_{1l}^2\\ \sigma_{21}^2 & \sigma_{22}^2 & \cdots & \sigma_{2l}^2\\ \vdots & \vdots & \ddots & \vdots\\ \sigma_{l1}^2 & \sigma_{l2}^2 & \cdots & \sigma_{ll}^2\\ \end{bmatrix}$

数学表达

p (x) N (μ, Σ)

$p(x) ~ N(\mu, \Sigma)$

1.3 正态分布的特点

$K$ 个参数(均值和方差)决定 $L-dim$ 的正态分布

K = l + l (l + 1) / 2

$K = l + l \ (l+1)/2$

超椭球面(super-ellipsoid)上点概率值相等

这里写图片描述

协方差矩阵的特征向量决定主轴，而且主轴的长度和协方差矩阵的特征向量是成比例的。
对于正态分布来说，不相关和独立是相等的
如果x是独立的，那么协方差矩阵是对角矩阵

二、贝叶斯分类器设计

这一小节的目的是：在输入 $x$ 是正态分布的前提下(假设输入的变量是服从正态分布的)，设计一个最小误差MPE贝叶斯分类器。

2.1 理论推导

这里，我们考虑每个类别数据都是服从正态分布的。同样的，我们判决函数用 $ln$ 函数，那么我们能得到如下的决策函数。

最低0.47元/天解锁文章

关注

7
点赞
踩
58

收藏

觉得还不错? 一键收藏
1
评论
[贝叶斯七]之正态分布贝叶斯决策

贝叶斯是非常传统，理论简单，但是非常有效的一种机器学习方法。经过大量实验表明，贝叶斯方法是极具鲁棒性的。至今为止仍然有很多人在研究贝叶斯的基础理论，而且发现许多算法都可以由贝叶斯推导而来，所以贝叶斯是具有极大的研究价值的理论。这一章节我们就来扯一扯正态分布数据的贝叶斯决策理论，看看我们能搞点什么事情出来。自己多多推导，没准能发现新的大陆。许多优秀的算法，比如SVM等等往往就是这样诞生的。...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。