【统计学习方法】第二章感知机和课后习题

最新推荐文章于 2024-02-19 11:00:00 发布

刘大望

最新推荐文章于 2024-02-19 11:00:00 发布

阅读量712

点赞数

分类专栏：统计学习方法文章标签：统计学习方法

本文链接：https://blog.csdn.net/qq_29407397/article/details/106771040

版权

统计学习方法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

第二章感知机

在学习一个模型的时候应该问：

模型的适用条件
要解决什么问题
对应统计学习方法的三个要素，假设空间，策略，算法
感知机要解决的问题是二分类问题，假设是数据是可分的。

2.1 感知机模型

符号说明：
输入空间： $\subseteq R^{n}$
输入变量： $\in X$
输出空间： $Y=\{+1,-1\}$
输出变量： $\in\{+1,-1\}$
假设空间：
$f(x)=\operatorname{sign}(w \cdot x+b)$
其中sign是符号函数
感知机模型

2.2 感知机的学习策略

损失函数：
误分类点到超平面的距离：
$b)=-\sum_{x_{i} \in M} y_{i}\left(w \cdot x_{i}+b\right)$
其中M是误分类点的集合。

2.4 感知机学习算法

2.4.1 随机梯度下降：

输入：
训练数据集 $T=\left[\left(x_{1}, y_{1}\right), \dots,\left(x_{N}, y_{N}\right)\right)$
学习率 $\eta$

选取初值 $w_{0}, b_{0}$
在训练集中选取数据 $\left(x_{i}, y_{i}\right)$
如果 $y_{i}\left(w \cdot x_{i}+b\right) \leq 0$
$w:=w+\eta y_{i} x_{i}$
$b:=b+\eta y_{i}$
转至2，直到训练集中没有误分类的点

输出w,b
在这里插入图片描述

2.4.2 感知机模型的对偶形式

感知机模型的对偶形式
$\begin{array}{c} f(\chi)=\operatorname{sign}\left(\sum_{j=1}^{N} \alpha_{j} y_{j} x_{j} \cdot x+b\right) \\ \alpha=\left(\alpha_{1}, \cdots \alpha_{N}\right)^{T} \end{array}$

算法：
输入：
训练数据集 $T=\left[\left(x_{1}, y_{1}\right), \dots,\left(x_{N}, y_{N}\right)\right)$
学习率 $\eta$
1.初值 $\alpha:=0, b:=0$
2.在训练集中选取数据 $\left(x_{i}, y_{i}\right)$
3.如果 $y_{i}\left(\sum_{j=1}^{N} \alpha_{j} y_{j} x_{j} \cdot x+b\right) \leq 0$
$\alpha_{i}:=\alpha_{i}+\eta$
$b:=b+\eta y_{i}$
4. 转至2，直到训练集中没有误分类的点