周志华西瓜书《机器学习》习题提示——第7章

人工干智能

已于 2023-07-24 16:08:51 修改

阅读量556

点赞数

分类专栏：《机器学习》周志华【西瓜书】辅导文章标签：机器学习人工智能

于 2023-07-23 10:59:41 首次发布

本文链接：https://blog.csdn.net/qiy_icbc/article/details/131877116

版权

《机器学习》同时被 2 个专栏收录

143 篇文章 5 订阅

订阅专栏

周志华【西瓜书】辅导

143 篇文章 29 订阅

订阅专栏

文章详细介绍了贝叶斯分类器的原理，包括朴素贝叶斯和最优贝叶斯分类器的公式，以及在属性条件不独立情况下的处理方法。讨论了分类问题中的统计修正、降维技术和AODE算法。同时提到了贝叶斯网和贝叶斯图络学习中的结构学习和参数估计方法。

摘要由CSDN通过智能技术生成

习题提示

7.1：
设前三个属性（色泽，根蒂，敲声）分别为 $x_1,x_2,x_3$ ，类别（好瓜，坏瓜）分别为 $c_1,c_2$ ，由【西瓜书(7.16)(7.17)】式求类条件概率的估值。

7.2：
最优贝叶斯分类器为：
$\begin{align} h^*(\boldsymbol{x})=\mathop{\arg\max}\limits_{c \in \mathcal{Y} }P(c|\boldsymbol{x}) \tag{1} \end{align}$

朴素贝叶斯分类器是指式(1)中 $P(c|(\boldsymbol{x})$ 满足：
$\begin{align} p(c|\boldsymbol{x}) &=\frac{P(c)}{P(\boldsymbol{x})}\mathop{\prod }\limits_{i=1}^dP(x_i|c) \tag{2} \end{align}$
式(2)是在属性条件独立假设下推导的。当该假设不满足时，有：
$\begin{align} p(c|\boldsymbol{x})&=\frac{P(c)}{P(\boldsymbol{x})}P(\boldsymbol{x}|c)\notag\\ &=\frac{P(c)}{P(\boldsymbol{x})}\mathop{\prod }\limits_{i=1}^dP(x_i|c,x_{1:\,(i-1)}),\quad x_{1:\,(i-1)}=(x_1,x_2,\cdots,x_{i-1}) \tag{3} \end{align}$

现考虑二分类问题：

朴素贝叶斯分类器演变为：
$\begin{align} h^*(\boldsymbol{x})= \begin{cases} \, c_1 ,\qquad \left(\frac{P(c_1)}{P(c_2)}\mathop{\prod }\limits_{i=1}^d\frac{P(x_i|c_1)}{P(x_i|c_2)} \geqslant 1 \right)\\ \, c_2 ,\qquad \left(\frac{P(c_1)}{P(c_2)}\mathop{\prod }\limits_{i=1}^d\frac{P(x_i|c_1)}{P(x_i|c_2)} <1 \right) \end{cases} \tag{4} \end{align}$

最优贝叶斯分类器（无属性条件独立的假设）演变为：
$\begin{align} h^*(\boldsymbol{x})= \begin{cases} \, c_1 ,\qquad \left(\frac{P(c_1)}{P(c_2)}\mathop{\prod }\limits_{i=1}^d\frac{P(x_i|c_1,x_{1:\,(i-1)})}{P(x_i|c_2,x_{1:\,(i-1)})} \geqslant 1 \right)\\ \, c_2 ,\qquad \left(\frac{P(c_1)}{P(c_2)}\mathop{\prod }\limits_{i=1}^d\frac{P(x_i|c_1,x_{1:\,(i-1)})}{P(x_i|c_2),x_{1:\,(i-1)}} <1 \right) \end{cases} \tag{5} \end{align}$

显然，当下式(6)时，可由式(4)代替式(5)。
$\begin{align} \frac{P(x_i|c_1,x_{1:\,(i-1)})}{P(x_i|c_2,x_{1:\,(i-1)})}\approx \frac{P(x_i|c_1)}{P(x_i|c_2)} \tag{6} \end{align}$
而式(6)（保持比例不变）在有些情况下是成立或近似成立的，故题述结论成立。

7.3：
修正的统计式为【西瓜书(7.19)(7.20)】。

7.4：
本题为开放式讨论，如：取对数，类似于对数似然；用主成分分析法，选取 $d$ 个属性；降维的方法；等等。

7.5：
参见7.2 再谈线性判别分析（高斯分布下的线性判别分析LDA实现了贝叶斯分类器）。

7.6：AODE:先用【西瓜书(7.24)(7.25)】对训练集中的数据进行“计数”，再用【西瓜书(7.23)】计算得到概率 $P(c_i|\boldsymbol{x})$ ，取使概率最大的类别 $c_i$ 。

7.7：
$c,x_i)$ 中， $x_i$ 为属性，有 $d$ 个属性， $c$ 与 $x_i$ 均为二值，因此事件 $c,x_i)$ 有4个基本事件，而每个需要30个样例来估计其概率，在最坏情况下，需要的总样例数至少为 $d\times4\times 30$ 个，最好情况下， $P(c=0,\cdot)$ 和 $P(c=1,\cdot)$ 这就至少需要60个样本，假定这时取 $m^{'} = 30$ ，且只有一个属性有一个取值的样本数大于30，即满足 $|D_{x_i}|\geqslant m'$ 的 $i$ 只有1个（不妨设为 $x_1$ ），由【西瓜书(7.23)】知，只需要估计 $P(c=0,x_1)$ 和 $P(c=1,x_1)$ ，即60个样本就够了。