（《机器学习》完整版系列）附录 ——6、指示函数及应用（将分段函数表达成一个式子的技术）

人工干智能

已于 2023-03-31 11:25:58 修改

阅读量436

点赞数

分类专栏：周志华【西瓜书】辅导《机器学习》文章标签：算法机器学习数据挖掘线性代数

于 2023-02-27 17:28:36 首次发布

本文链接：https://blog.csdn.net/qiy_icbc/article/details/129246048

版权

周志华【西瓜书】辅导同时被 2 个专栏收录

143 篇文章 23 订阅

订阅专栏

《机器学习》

143 篇文章 5 订阅

订阅专栏

指示函数是将分段函数表达成一个式子的技术

指示函数及应用

集合 $A$ 的指示函数定义为
$\begin{align} \mathbb{I} (\boldsymbol{x} \in A) & =\mathbb{I}_A (\boldsymbol{x})\notag \\ & = \begin{cases} \, 1\, ,\qquad \text{当$\boldsymbol{x} \in A$时} \\ \, 0\, ,\qquad \text{当$\boldsymbol{x} \notin A$时} \end{cases} \tag{B1} \end{align}$
显然有 $\mathbb{I}_A (\boldsymbol{x})+\mathbb{I}_{\overline{A}} (\boldsymbol{x})=1$ ，其中， $\overline{A}$ 为集 $A$ 的补集。

我们看分段函数的指示函数表示，若
$\begin{align*} f(\boldsymbol{x})= \begin{cases} \, 1\, ,\qquad \text{当$\boldsymbol{x} \in A$时} \\ \, -1\, ,\qquad \text{当$\boldsymbol{x} \notin A$时} \end{cases} \end{align*}$
则
$\begin{align} f(\boldsymbol{x}) & =\mathbb{I}_A (\boldsymbol{x})-\mathbb{I}_{\overline{A}} \notag \\ & =\mathbb{I}_A (\boldsymbol{x})-(1-\mathbb{I}_A) \notag \\ & =2\mathbb{I}_A (\boldsymbol{x})-1 \tag{B2} \end{align}$

同样地，若
$\begin{align} f(\boldsymbol{x})= \begin{cases} \, a(\boldsymbol{x})\, ,\qquad \text{当$\boldsymbol{x} \in A$时} \\ \, b(\boldsymbol{x})\, ,\qquad \text{当$\boldsymbol{x} \notin A$时} \end{cases} \tag{B3} \end{align}$
则
$\begin{align} f(\boldsymbol{x}) & =a(\boldsymbol{x})\mathbb{I}_A (\boldsymbol{x})+b(\boldsymbol{x})\mathbb{I}_{\overline{A}} (\boldsymbol{x}) \tag{B4} \end{align}$
特别地，当 $b(\boldsymbol{x})\equiv 0$ 时，有
$\begin{align} f(\boldsymbol{x}) & =a(\boldsymbol{x})\mathbb{I}_A (\boldsymbol{x}) \tag{B5} \end{align}$

式(B4)是以和来表示，同样可以用积来表示
$\begin{align} f(\boldsymbol{x}) & =a(\boldsymbol{x})^{\mathbb{I}_A (\boldsymbol{x})}b(\boldsymbol{x})^{\mathbb{I}_{\overline{A}} (\boldsymbol{x})} \tag{B6} \end{align}$
扩展到多段，第 $i$ 段的变量范围为 $A_i(\boldsymbol{x})$ 、函数为 $a_i(\boldsymbol{x})$ ，则
$\begin{align} f(\boldsymbol{x}) & =\sum_{i=1}^na_i(\boldsymbol{x})\mathbb{I}[A_i(\boldsymbol{x})] \tag{B7} \\ f(\boldsymbol{x}) & =\mathop{\prod}\limits_{i=1}^na_i(\boldsymbol{x})^{\mathbb{I}[A_i(\boldsymbol{x})]} \tag{B8} \end{align}$
特别地，集合 ${a_i\}_{i=1}^n$ 中任一元素 $a_k$ 可以表示为全体元素的“和”（“积”）
$\begin{align} a_k & =\sum_{i=1}^na_i\mathbb{I}(i=k) \tag{B9} \\ a_k & =\mathop{\prod}\limits_{i=1}^n{a_i}^{\mathbb{I}(i=k)} \tag{B10} \end{align}$
指示函数的数学期望
$\begin{align} \mathop{\mathbb{E} }\limits_{x\in D}\mathbb{I}_A (x) & =\int_D \mathbb{I}_A (x)p(x)\,\mathrm{d}x\notag \\ & =\int_A \mathbb{I}_A (x)p(x)\,\mathrm{d}x+\int_{D\setminus A} \mathbb{I}_A (x)p(x)\,\mathrm{d}x\notag \\ & =\int_A 1\cdot p(x)\,\mathrm{d}x+\int_{D\setminus A} 0\cdot p(x)\,\mathrm{d}x\notag \\ & =\int_A p(x)\,\mathrm{d}x\notag \\ & =P(x\in A) \tag{B11} \end{align}$
由上述若干式子，即可理解【西瓜书式(8.9)】的推导过程。如：
$\begin{align*} \mathrm{e}^{-f(\boldsymbol{x}){\alpha }_th_t(\boldsymbol{x})} & = \begin{cases} \, \mathrm{e}^{-{\alpha }_t}\, ,\qquad \text{当$f(\boldsymbol{x})=h_t(\boldsymbol{x})$时}\notag \\ \, \mathrm{e}^{{\alpha }_t}\, ,\qquad \text{当$f(\boldsymbol{x})\neq h_t(\boldsymbol{x})$时}\notag \\ \end{cases} \\ & =\mathrm{e}^{-{\alpha }_t}\mathbb{I} (f(\boldsymbol{x})=h_t(\boldsymbol{x}))+\mathrm{e}^{{\alpha }_t}\mathbb{I} (f(\boldsymbol{x})\neq h_t(\boldsymbol{x}))\qquad \text{（由式(B4)）} \end{align*}$
这即是【西瓜书式(8.9)】推导过程的第2个等号，由式(B11)即得第3个等号。