统计学习方法第十一章习题答案_统计学习方法第十一章课后习题答案-CSDN博客

本文链接：https://blog.csdn.net/qq_41562704/article/details/106597990

本文解析了无向图描述的概率图模型的因子分解式，详细推导了Z(x)的计算公式，并通过实例展示了条件随机场模型的学习过程与状态序列概率计算。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

习题11.1
习题 11.2
习题11.3
习题11.4

习题11.1

写出图11.3中无向图描述的概率图模型的因子分解式。
在这里插入图片描述
解答
$P(Y_1,Y_2,Y_3,Y_4)=\frac{1}{Z} \psi_{c_1}(Y_1,Y_2,Y_3) \psi_{c_2}(Y_2,Y_3,Y_4)$
$Z=\sum_Y\psi_{c_1}(Y_1,Y_2,Y_3) \psi_{c_2}(Y_2,Y_3,Y_4)$

习题 11.2

证明 $Z(x)=\alpha_{n}^{\mathrm{T}}(x) \cdot 1=1^{\mathrm{T}} \cdot \beta_{0}(x)$ ，其中1是元素均为1的m维列向量。
解答
本式子出现在书的199页11.3.1前向-后向算法这一小节
PS：书中是 $\beta_1(x)$ ，但是我个人觉得这儿应该是 $\beta_0(x)$
$Z(x)=(M_1(x)M_2(x)...M_{n+1}(x))_{start,stop}$ 即 $M_1(x)M_2(x)...M_{n+1}(x)$ 得到的结果矩阵 $M$ (mm维度)的 $(s t a r t, s t o p)$ 位置的元素。其中 $M_{n+1}(x)$ 为m*m维度的矩阵，但是只有stop列为1，其余为0。或者说 $Z (x)$ 的值为 $M_1(x)M_2(x)...M_{n}(x)$ 结果矩阵 $M^{'}$ 的start行的所有元素之和。
$\alpha_{n}^{\mathrm{T}}(x) \cdot 1\\=\alpha_{n-1}^{\mathrm{T}}(x)M_n(x) \cdot 1\\=\alpha_{n-2}^{\mathrm{T}}(x)M_{n-1}(x)M_n(x) \cdot 1\\=...\\=\alpha^T_0(x) M_1(x)M_2(x)...M_n(x)\cdot 1\\=Z(x)$
说明： $\alpha^T_0(x) M_1(x)M_2(x)...M_n(x)$ 得到的是1m维度的行向量，其值为 $M_1(x)M_2(x)...M_{n}(x)$ 的 $s t a r t$ 行的元素，将其与1是元素均为1的m维列向量点乘，得到的即为 $M_1(x)M_2(x)...M_{n+1}(x)$ 的 $(s t a r t, s t o p)$ 位置的元素值。

$1^{\mathrm{T}} \cdot \beta_{0}(x)\\=1^T\cdot M_1(x)\beta_1(x)\\=...\\=1^T\cdot M_1(x)M_2(x)M_3(x)...M_n(x)\cdot \beta_{n+1}(x)\\=Z(x)$
说明：同理， $M_1(x)M_2(x)M_3(x)...M_n(x)\cdot \beta_{n+1}(x)$ 得到的是列向量，其每个值为 $M_1(x)M_2(x)...M_{n}(x)$ 的对应的一行元素之和（除了start列处，其余元素为0，与 $1^T$ 点乘后得到的即为 $M_1(x)M_2(x)...M_{n+1}(x)$ 的 $(s t a r t, s t o p)$ 位置的元素值。

习题11.3

写出条件随机场模型学习的梯度下降法.
参考Blog

习题11.4

参考图11.6的状态路径图，假设随机矩阵 $M_1(x),M_2(x),M_3(x),M_4(x)$ 分别是
$M_{1}(x)=\left[\begin{array}{cc}0 & 0 \\ 0.5 & 0.5\end{array}\right], \quad M_{2}(x)=\left[\begin{array}{cc}0.3 & 0.7 \\ 0.7 & 0.3\end{array}\right]$
$M_{3}(x)=\left[\begin{array}{cc}0.5 & 0.5 \\ 0.6 & 0.4\end{array}\right], \quad M_{4}(x)=\left[\begin{array}{cc}0 & 1 \\ 0 & 1\end{array}\right]$
求以start=2为起点stop=2为终点的所有路径的状态序列y的概率及概率最大的状态序列.
解答
$y=(1,1,1)=a_{21}b_{11}c_{11}=0.5*0.3*0.5=0.075$
$y=(1,1,2)=a_{21}b_{11}c_{12}=0.5*0.3*0.5=0.075$
$y=(1,2,1)=a_{21}b_{12}c_{21}=0.5*0.7*0.6=0.21$ （最大）
$y=(1,2,2)=a_{21}b_{12}c_{22}=0.5*0.7*0.4=0.14$
$y=(2,1,1)=a_{22}b_{21}c_{11}=0.5*0.7*0.5=0.175$
$y=(2,1,2)=a_{22}b_{21}c_{12}=0.5*0.7*0.5=0.175$
$y=(2,2,1)=a_{22}b_{22}c_{21}=0.5*0.3*0.6=0.09$
$y=(2,2,2)=a_{22}b_{22}c_{22}=0.5*0.3*0.4=0.06$