【国科大模式识别】第一次作业

最新推荐文章于 2024-07-22 16:11:51 发布

果壳小旋子

最新推荐文章于 2024-07-22 16:11:51 发布

阅读量1.1k

点赞数 2

文章标签：算法 python

本文链接：https://blog.csdn.net/m0_47867419/article/details/128534722

版权

【题目一】设 $\omega_{\max }$ 为类别状态, 此时对所有的 $\ldots, c)$ , 有 $P\left(\omega_{\max } \mid \boldsymbol{x}\right) \geq$ $P\left(\omega_i \mid \boldsymbol{x}\right)$

证明 $P\left(\omega_{\max } \mid \boldsymbol{x}\right) \geq 1 / c$ （最大值大于平均值）
$P\left(\omega_{\max } \mid \boldsymbol{x}\right) \geq \frac{1}{c} \sum_{i=1}^c P\left(\omega_i \mid \boldsymbol{x}\right)=\frac{1}{c}$
证明对于最小错误率判定规则, 平均错误概率为
$P(\text { error })=1-\int P\left(\omega_{\max } \mid \boldsymbol{x}\right) p(\boldsymbol{x}) d \boldsymbol{x}$

【解】当 $\omega_{\text {max }}$ 不是样本的真实类别时, 决策出错, 因此错误率为（回忆一下期望公式）
$P(\text { error })=\mathbb{E}_x\left(1-P\left(\omega_{\max } \mid \boldsymbol{x}\right)\right)=1-\int P\left(\omega_{\max } \mid \boldsymbol{x}\right) p(\boldsymbol{x}) d \boldsymbol{x}$

利用这两个结论证明 $\leq(c-1) / c$

【解】由 (1)(2) 的结论
$P(\text { error })=1-\int P\left(\omega_{\max } \mid \boldsymbol{x}\right) p(\boldsymbol{x}) d \boldsymbol{x} \leq 1-\int \frac{1}{c} p(\boldsymbol{x}) d \boldsymbol{x}=\frac{c-1}{c}$

描述一种情况, 在此情况下有 $P (error) = (c - 1) / c$

【解】当对任意类别 $i$ 都有 $P\left(\omega_i \mid \boldsymbol{x}\right)=1 / c$ 时, $P (error) = (c - 1) / c$

【题目二】对于一个 $c$ 类分类问题, 假设各类先验概率为 $P\left(\omega_i\right), i=1, \ldots, c$ ; 条件概率密度为 $P\left(\boldsymbol{x} \mid \omega_i\right), i=1, \ldots, c,(\boldsymbol{x}$ 表示特征向量 $)$ ; 将第 $j$ 类样本判别为第 $i$ 类的损失为 $\lambda_{i j}$

请写出贝叶斯风险最小决策和最小错误率决策的决策规则

【解】最小风险决策:
$\underset{i}{\operatorname{argmin}} R\left(\alpha_i \mid \boldsymbol{x}\right)$
其中, $R\left(\alpha_i \mid \boldsymbol{x}\right)=\sum_{j=1}^c \lambda\left(\alpha_i \mid \omega_j\right) P\left(\omega_j \mid \boldsymbol{x}\right)$ .
最小错误率决策: 此时风险为 0-1 loss, 即 $\lambda\left(\alpha_i \mid \omega_j\right)=\left\{\begin{array}{l}0, i=j \\ 1, i \neq j\end{array}\right.$
$R\left(\alpha_i \mid \boldsymbol{x}\right)=\sum_{j=1}^c \lambda\left(\alpha_i \mid \omega_j\right) P\left(\omega_j \mid \boldsymbol{x}\right)=\sum_{j\ne i}P\left(\omega_j \mid \boldsymbol{x}\right)=1-P\left(\omega_i \mid x\right)$
决策为 $\underset{i}{\arg \max } P\left(\omega_i \mid x\right)$ .

引入拒识 (表示为第 $c + 1$ 类), 假设决策损失为
$\lambda\left(\alpha_i \mid \omega_j\right)= \begin{cases}0, & i=j \quad i, j=1, \ldots, c \\ \lambda_r, & i=c+1 \\ \lambda_s, & \text { otherwise }\end{cases}$
请写出最小风险决策的决策规则 (包括分类规则和拒识规则)

【解】注意这边按照定义， $c + 1$ 类判别为 $i$ 类的风险也是 $\lambda_s$ （注意理解这个拒识的定义，很绕，我用排除法，如果不属于第一种情况，又不属于第二种情况，那就是第三种情况）
$R\left(\alpha_i \mid \boldsymbol{x}\right)=\sum_{j=1}^{c+1} \lambda\left(\alpha_i \mid \omega_j\right) P\left(\omega_j \mid \boldsymbol{x}\right)=\lambda_s\left[1-P\left(\omega_i \mid \boldsymbol{x}\right)\right], i=1, \cdots, c$
注意这边按照定义， $c + 1$ 类判别为 $c + 1$ 类的风险也是 $\lambda_r$
$R\left(\alpha_{c+1} \mid \boldsymbol{x}\right)=\sum_{j=1}^{c+1} \lambda\left(\alpha_{c+1}\mid \omega_j\right) P\left(\omega_j \mid \boldsymbol{x}\right)=\lambda_r$

由 $R_i(x)$ 的定义可计算得:
$R_i(x)=\left\{\begin{array}{c} \lambda_s\left[1-P\left(\omega_i \mid \boldsymbol{x}\right)\right], i=1, \cdots, c \\ \lambda_r, \text { reject } \end{array}\right.$
因此, 带拒识的最小风险决策为:
$\underset{i}{\arg \min } R_i(x)=\left\{\begin{array}{c} \underset{i}{\arg \max } P\left(\omega_i \mid \boldsymbol{x}\right), \text { if } \max P\left(\omega_i \mid \boldsymbol{x}\right)>1-\lambda_r / \lambda_s \\ \text { reject, otherwise } \end{array}\right.$

【题目三】考虑三维正态分布 $p(\boldsymbol{x} \mid \omega) \sim N(\boldsymbol{\mu}, \Sigma)$ , 其中
$\boldsymbol{\mu}=\left(\begin{array}{l} 1 \\ 2 \\ 2 \end{array}\right), \Sigma=\left(\begin{array}{lll} 1 & 0 & 0 \\ 0 & 5 & 2 \\ 0 & 2 & 5 \end{array}\right)$

构造白化变换 $\mathrm{A}_\omega=\Phi \Lambda^{-1 / 2}$ , 计算分别表示本征向量和本征值的矩阵 $\Phi$ 和 $\Lambda$ ; 接下来, 将此分布转换为以原点为中心、协方差矩阵为单位阵的分布, 即 $p(\boldsymbol{x} \mid \omega) \sim N(\mathbf{0}, \mathrm{I})$

【解】计算可知协方差矩阵 $\Sigma$ 的本征值为: $\lambda_1=1, \lambda_2=3, \lambda_3=7$ , 其对应的本征向量分别为: $v_1=(0,1,-1)^T / \sqrt{2}, v_2=(0,1,1)^T / \sqrt{2}, v_3=$ $(1,0,0)^T, \Phi$ 和 $\Lambda$ 和 $A_\omega$ 为:
$\begin{gathered} \Phi=\left(\begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 / \sqrt{2} & 1 / \sqrt{2} \\ 0 & -1 / \sqrt{2} & 1 / \sqrt{2} \end{array}\right), \quad \Lambda=\operatorname{diag}(1,3,7) \\ \mathrm{A}_\omega=\Phi \Lambda^{-1 / 2}=\left(\begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 / \sqrt{6} & 1 / \sqrt{14} \\ 0 & -1 / \sqrt{6} & 1 / \sqrt{14} \end{array}\right) \end{gathered}$
在这里插入图片描述

通过变换 $\boldsymbol{y}=\mathrm{A}_\omega{ }^T(\boldsymbol{x}-\boldsymbol{\mu})$ 可将原分布变换到 $N(\mathbf{0}, \mathrm{I})$ （单纯的白化变换只能把协方差矩阵变为单位矩阵，这边要求均值为 $0$ ，所以还得平移一下）

将 (1) 中的白化变换应用于点 $\boldsymbol{x}_0=(0.5,0,1)^t$ , 求其经过白化变换后的点 $x_\omega$

【解】 $\boldsymbol{x}_\omega=\mathrm{A}_\omega^T(\boldsymbol{x}-\boldsymbol{\mu})=(-0.5,-1 / \sqrt{6},-3 / \sqrt{14})^T$

通过详细计算, 证明原分布中从 $\boldsymbol{x}_0$ 到均值 $\boldsymbol{\mu}$ 的 Mahalanobis 距离与变换后的分布中从 $\boldsymbol{x}_\omega$ 到 $\mathbf{0}$ 的 Mahalanobis 距离相等。

【解】 $x_0$ 到 $\mu$ 的马氏距离为: $\sqrt{\frac{89}{84}}, x_\omega$ 到 0 的马氏距离为: $\sqrt{\frac{89}{84}}$ , 两者相等

概率密度在一个一般的线性变换下是否保持不变? 换句话说, 对于某线性变换 $T$ , 是否有 $p\left(\boldsymbol{x}_0 \mid N(\boldsymbol{\mu}, \Sigma)\right)=p\left(T^t \boldsymbol{x}_0 \mid N\left(T^t \boldsymbol{\mu}, T^t \Sigma T\right)\right)$ ? 解释原因

【解】
$\begin{aligned} p\left(T^t \boldsymbol{x}_0 \mid N\left(T^t \boldsymbol{\mu}, T^t \Sigma T\right)\right) & =\frac{1}{(2 \pi)^{d / 2}\left|T^t \Sigma T\right|^{1 / 2}} \exp \left(-\frac{1}{2}\left(T^t x-T^t \mu\right)^t\left(T^t \Sigma T\right)^{-1}\left(T^t x-T^t \mu\right)\right) \\ & =\frac{1}{(2 \pi)^{d / 2}\left|T^t \Sigma T\right|^{1 / 2}} \exp \left(-\frac{1}{2}(x-\mu)^t T T^{-1} \Sigma^{-1} T^{-t} T^t(x-\mu)\right) \\ & =\frac{1}{(2 \pi)^{d / 2}|\Sigma|^{1 / 2}} \exp \left(-\frac{1}{2}(x-\mu)^t \Sigma^{-1}(x-\mu)\right) \end{aligned}$

【题目四】对一个 $c$ 类分类问题, 特征向量 $\boldsymbol{x} \in \mathcal{R}^d$ , 假设各类先验概率相等, 每一类条件概率密度为高斯分布

请写出类条件概率密度函数的数学形式

【解】类条件概率密度服从 $d$ 维高斯分布, 故类条件概率密度函数的数学形式为:
$p\left(\boldsymbol{x} \mid \omega_i\right)=\frac{1}{(2 \pi)^{d / 2}\left|\Sigma_i\right|^{1 / 2}} \exp \left[-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)^T \Sigma_i^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)\right]$

请写出在下面两种情况下的最小错误率决策判别函数：(a) 类协方差矩阵不等; (b) 所有类协方差矩阵相等.

【解】判别函数计算公式为:
$g_i(\boldsymbol{x})=\ln p\left(\boldsymbol{x} \mid \omega_i\right)+\ln P\left(\omega_i\right)$
类协方差矩阵不等时：可以进一步写为:
$g_i(\boldsymbol{x})=-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)^T \boldsymbol{\Sigma}_i^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)-\frac{d}{2} \ln 2 \pi-\frac{1}{2} \ln \left|\boldsymbol{\Sigma}_i\right|+\ln P\left(\omega_i\right)$
不考虑与类别 $i$ 无关的项, 且由于各类先验概率相等, 进一步有:
$g_i(\boldsymbol{x})=-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)^T \boldsymbol{\Sigma}_i^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)-\frac{1}{2} \ln \left|\boldsymbol{\Sigma}_i\right|$
所有类协方差矩阵相等时: 可以进一步写为:
$g_i(\boldsymbol{x})=-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)^T \boldsymbol{\Sigma}^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)-\frac{d}{2} \ln 2 \pi-\frac{1}{2} \ln |\boldsymbol{\Sigma}|+\ln P\left(\omega_i\right)$
不考虑与类别 $i$ 无关的项, 且由于各类先验概率相等, 进一步有:
$g_i(\boldsymbol{x})=-\frac{1}{2}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)^T \boldsymbol{\Sigma}^{-1}\left(\boldsymbol{x}-\boldsymbol{\mu}_i\right)$

在基于高斯概率密度的二次判别函数中, 当协方差矩阵为奇异时, 判别函数变得不可计算。请说出两种克服协方差奇异的方法。

【解】a. 降维, 减少特征向量的维度, 使得较低维度的协方差矩阵可逆; b. 矩阵对角化之后在特征值为 0 的位置加上小的常数; c. 求伪逆矩阵。 $\boldsymbol{\Sigma}^{\dagger}=\left(\boldsymbol{\Sigma}^T \boldsymbol{\Sigma}\right)^{-1} \boldsymbol{\Sigma}^T$