（《机器学习》完整版系列）第8章集成学习——8.5再谈投票法（硬投票：“同意”与“不同意”，软投票：同意张三70%，同意李四30%）

人工干智能

已于 2023-03-31 10:38:38 修改

阅读量579

点赞数 1

分类专栏：周志华【西瓜书】辅导《机器学习》文章标签：集成学习人工智能机器学习

于 2023-02-28 18:00:59 首次发布

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129266641

版权

周志华【西瓜书】辅导同时被 2 个专栏收录

143 篇文章 29 订阅

订阅专栏

《机器学习》

143 篇文章 5 订阅

订阅专栏

简单投票法的基学习器均以“ $- 1$ ”或“ $+ 1$ ”进行投票，现在我们让其以“0”或“1”进行投票，称为“硬投票”。包括：得票多的胜出、必须超过半数、加权投票
硬投票指要么“同意”要么“不同意”，而软投票是指“同意度”，即投票者把面额为1的票按自己的意愿分割到不同的候选者，如，同意张三70%，同意李四30%。

再谈投票法

硬投票

前述的基学习器均以“ $- 1$ ”或“ $+ 1$ ”进行投票，现在我们让其以“0”或“1”进行投票，称为“硬投票”。

设有 $N$ 类，类别标记集合为 $\{C_1,C_2,\cdots,C_N\}$ ，有 $T$ 个分类器 $h_i,(i=1,2,\cdots,T)$ ，对样本 $\boldsymbol{x}$ 的预测为 $h_i(\boldsymbol{x})=C_j$ 。预测统计生成表8.1。

本来是要将 $\boldsymbol{x}$ 分类到 $\{C_1,C_2,\cdots,C_N\}$ 中，现在我们将 $\boldsymbol{x}$ 视为一张选票， $h_i$ 视为投票人，他要在选票上勾上候选人（ $C_1,C_2,\cdots,C_N$ ）之一，即 $h_i$ 对 $\boldsymbol{x}$ 的投票结果
$\begin{align} h_i^j(\boldsymbol{x})= \begin{cases} \, 1\, ,\qquad \text{若}h_i(\boldsymbol{x})=C_j \\ \, 0\, ,\qquad \text{若}h_i(\boldsymbol{x}) \neq C_j \end{cases} \tag{8.33} \end{align}$
体现在表8.1中的 $h_i$ 所在的行，表中每行（中间部分）是一个“独1向量”。从列的角度看，第 $j$ 列为候选者 $C_j$ 的得票情况，最后一行表示对每位候选者的记票结果。

投票人（ $h_i,(i=1,2,\cdots,T)$ ）对 $\boldsymbol{x}$ 的集体决策记为 $H(\boldsymbol{x})$ ，不同的决策对应不同的游戏规则：

（1）得票多的胜出

若
$\begin{align} \max\left\{\sum_{k=1}^Th_k^1(\boldsymbol{x}),\sum_{k=1}^Th_k^2(\boldsymbol{x}),\cdots,\sum_{k=1}^Th_k^i(\boldsymbol{x}),\cdots,\sum_{k=1}^Th_k^N(\boldsymbol{x})\right\} =\sum_{k=1}^Th_k^j(\boldsymbol{x}) \tag{8.34} \end{align}$
则 $H(\boldsymbol{x})=C_j$

通常以序号表示类别，即 $C_j=j$ ，则该规则可以简单地表达为
$\begin{align} H(\boldsymbol{x}) & =\mathop{\arg\max}\left\{\sum_{k=1}^Th_k^1(\boldsymbol{x}),\sum_{k=1}^Th_k^2(\boldsymbol{x}),\cdots,\sum_{k=1}^Th_k^i(\boldsymbol{x}),\cdots,\sum_{k=1}^Th_k^N(\boldsymbol{x})\right\}\notag \\ & =\mathop{\arg\max}\limits_j\sum_{k=1}^Th_k^j(\boldsymbol{x}) \tag{8.35} \end{align}$

当类别不是直接以序号代表时，则式(8.35)变为【西瓜书式(8.25)】。

（2）必须超过半数（在（1）的基础上）

若式(8.34) $>\frac{T}{2}$ ，则预测 $H(\boldsymbol{x})=C_j$ ，否则拒绝预测。

这即为【西瓜书式(8.24)】所表达的集成分类器，在该规则下，会出现“拒绝预测”的情况，这就是一些选举会出现流产情况。另外，当为二分类时，（2）与（1）等价。

（3）加权投票

仍然是每人 $h_i$ 一张票，但汇总时，每人的权重不一样。设 $w_i$ 为 $h_i$ 的权重（ $w_i>0,\ \sum_{i=1}^Tw_i=1$ ），则表8.1中最后一行的统计变为
$\sum_{k=1}^Tw_kh_k^1(\boldsymbol{x}),\sum_{k=1}^Tw_kh_k^2(\boldsymbol{x}),\cdots,\sum_{k=1}^Tw_kh_k^N(\boldsymbol{x})$
则（1）的式(8.35)变为
$\begin{align} H(\boldsymbol{x}) & =\mathop{\arg\max}\limits_j\sum_{k=1}^Tw_kh_k^j(\boldsymbol{x}) \tag{8.36} \end{align}$
当类别不是直接以序号代表时，则式(8.36)变为【西瓜书式(8.26)】。

同样可以得到在（2）的约束下的预测公式。

用指示函数表达

利用指示函数（6、指示函数及应用（将分段函数表达成一个式子的技术）），则式(8.33)可表达为
$\begin{align} h_i^j(\boldsymbol{x})=\mathbb{I} (j=h_i(\boldsymbol{x})) \tag{8.37} \end{align}$
其中，为简化以序号表示类别，即 $C_j=j$ 。

则“得票多者胜出”的式(8.35)变为
$\begin{align} H(\boldsymbol{x}) & =\mathop{\arg\max}\limits_j\sum_{k=1}^T\mathbb{I} (h_k(\boldsymbol{x})=j)\notag \\ & =\mathop{\arg\max}\limits_{y \in \mathcal{Y} }\sum_{k=1}^T\mathbb{I} (h_k(\boldsymbol{x})=y)\quad\text{（换变量字母）} \tag{8.38} \end{align}$
这即是【西瓜书图8.5】Bagging算法中的输出表达式。

设测试集为 $T_D$ ，仅考虑测试集上的预测，即
$\begin{align} H^{T_D}(\boldsymbol{x}) & = \begin{cases} \, H(\boldsymbol{x})\, ,&\qquad \text{（若$\boldsymbol{x}\in {T_D}$）}\notag \\ \, 0\, ,&\qquad \text{（若$\boldsymbol{x}\notin {T_D}$）}\notag \\ \end{cases} \notag \\ & =H(\boldsymbol{x})\mathbb{I}(\boldsymbol{x}\in T_D)\qquad \text{（由式(B5)）} \tag{8.39} \end{align}$
则它对 $\boldsymbol{x}$ 预测的误差损失
$\begin{align} {\epsilon}^{T_D} (\boldsymbol{x}) & = \begin{cases} \, 0\, ,\qquad \text{当$H^{T_D}(\boldsymbol{x})=f(\boldsymbol{x})$时}\notag \\ \, 1\, ,\qquad \text{当$H^{T_D}(\boldsymbol{x})\neq f(\boldsymbol{x})$时}\notag \\ \end{cases} \\ & =\mathbb{I}(H^{T_D}(\boldsymbol{x})\neq f(\boldsymbol{x}))\qquad \text{（由式(B5)）} \tag{8.40} \end{align}$
则平均误差损失
$\begin{align} {\epsilon}^{T_D} & =\frac{1}{|T_D|}\sum_{\boldsymbol{x} \in T_D}{\epsilon}^{T_D} (\boldsymbol{x})\notag \\ & =\frac{1}{|T_D|}\sum_{\boldsymbol{x} \in T_D}\mathbb{I}(H^{T_D}(\boldsymbol{x})\neq f(\boldsymbol{x}))\qquad \text{（由式(8.40)）} \tag{8.41} \end{align}$
${\epsilon}^{T_D}$ 即为对 $H(\boldsymbol{x})$ 的泛化性能的度量【西瓜书式(8.21)】。

软投票

硬投票指要么“同意”要么“不同意”，而软投票是指“同意度”，即投票者把面额为1的票按自己的意愿分割到不同的候选者，如，同意张三70%，同意李四30%。

则式(8.33)变为了概率表达
$\begin{align} h_i^j(\boldsymbol{x})=P(C_j\,|\,\boldsymbol{x}) \tag{8.42} \end{align}$
且 $\sum_{j=1}^NP(C_j\,|\,\boldsymbol{x})=1$ ，即投票人 $h_i$ 认为 $\boldsymbol{x}$ 以概率 $P(C_j\,|\,\boldsymbol{x})$ 属于 $C_j$ 类。

基于式(8.42)，可以导出“得票多者胜出”、“必须过半数”、“加权胜出”等游戏决策下的表达式。

在软投票法下没有式(8.37)，故基于式(8.37)的Bagging算法是基于硬投票的。针对集成学习器 $H(\boldsymbol{x})$ 的性能度量式(8.41)，既适合于硬投票，也适合于软投票。

本文为原创，您可以：

点赞（支持博主）
收藏（待以后看）
转发（他考研或学习，正需要）
评论（或讨论）
引用（支持原创）
不侵权
上一篇：8.4 GBDT算法（逐次估值逼近）
下一篇：8.6 级联集成（Stacking算法、其他级联）

人工干智能

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
（《机器学习》完整版系列）第8章集成学习——8.5再谈投票法（硬投票：“同意”与“不同意”，软投票：同意张三70%，同意李四30%）

简单投票法的基学习器均以“$-1$”或“$+1$”进行投票，现在我们让其以“0”或“1”进行投票，称为“硬投票”。包括：得票多的胜出、必须超过半数、加权投票硬投票指要么“同意”要么“不同意”，而软投票是指“同意度”，即投票者把面额为1的票按自己的意愿分割到不同的候选者，如，同意张三70\%，同意李四30\%。
复制链接

扫一扫