【模式识别阅读笔记】第四章线性分类器

最新推荐文章于 2024-07-11 16:47:15 发布

east_fence

最新推荐文章于 2024-07-11 16:47:15 发布

阅读量808

点赞数

分类专栏：模式识别学习笔记文章标签：模式识别机器学习算法人工智能

本文链接：https://blog.csdn.net/east_fence/article/details/115679029

版权

模式识别学习笔记专栏收录该内容

1 篇文章

订阅专栏

文章目录

前言

这个系列的文章，是《模式识别》（张学工，清华大学出版社）的阅读笔记。由于一些原因，笔记从第四章开始进行整理。子标题的编号没有完全依据原书。

1 关于分类器设计

二分类任务：根据样本求出一个合适分类面，把样本正确的分成两类。

贝叶斯决策要求根据样本进行概率密度函数估计，这在高维和少样本对情况下不易做到，于是我们希望有直接更具样本求分类面的方法。
基于样本设计分类器重点关注三个问题：
（1）判别函数的类型，对于线性分类器，判别函数就是线性判别函数，对应的分类面也是线性的。
（2）分类器设计的目标/准则。即形式化的定义出来判别函数选择什么样的参数是可以的、是最好的。
（3）如何得到最优参数。是用启发式的方法，还是用数学理论去计算。

2线性判别函数

所有二分类的分类器都是基于以下的线性判别函数的：
$g(\mathbf{x})=\mathbf{w}^T\mathbf{x}+w_0$
准则也很符合直觉：
$\begin{matrix}g(\mathbf{x})>0,决策、\mathbf{x}\in \omega_1 \\g(\mathbf{x})<0,决策、\mathbf{x}\in \omega_2 \\g(\mathbf{x})=0,决策、\mathbf{x}可以分到任意一类或者拒绝 \end{matrix}$
$g(\mathbf{x})=0$ 定义了一个决策面 $H$ ，这是一个以 $\mathbf{w}$ 为法向量的平面。

特征空间、代数距离、几何距离

每个样本点 $\mathbf{x}$ 都可以表示到一个高维的特征空间里。这个样本点到分类面 $H$ 的代数距离就是 $g(\mathbf{x})$ 。这个值的大小是没有什么意义的，因为 $\mathbf{w}$ 的模是不确定的。真正有意义的是 $\mathbf{x}$ 到分类面的几何距离 $\frac{g(\mathbf{x})}{\left \|\mathbf{w} \right \|}$ 。

这个的推导如下：设几何距离为 $r$ ，从 $\mathbf{x}$ 出发向 $H$ 引垂线，交 $H$ 于 $\mathbf{x}_p$ 。由于 $\frac{\mathbf{w}}{\left \|\mathbf{w} \right \|}$ 是 $\mathbf{w}$ 方向的垂直距离，于是有
$\mathbf{x}=\mathbf{x}_p+r\frac{\mathbf{w}}{\left \|\mathbf{w} \right \|}$
带入线性判别函数，得
$g(\mathbf{x})=\mathbf{w}^T(\mathbf{x}_p+r\frac{\mathbf{w}}{\left \|\mathbf{w} \right \|})+w_0=0+r\frac{\mathbf{w}^T\mathbf{w}}{\left \|\mathbf{w} \right \|}$
所以
$r=\frac{g(\mathbf{x})}{\left \|\mathbf{w} \right \|}$