第二章--感知机---（2）

最新推荐文章于 2024-07-06 22:20:33 发布

翔燕

最新推荐文章于 2024-07-06 22:20:33 发布

阅读量123

点赞数

分类专栏：李航统计学习方法文章标签：感知机假设函数损失函数原始形式对偶形式

本文链接：https://blog.csdn.net/qq_36217665/article/details/100427927

版权

李航统计学习方法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1.模型简介

感知机是根据输入实例的特征向量 $x$ 对其进行二类分类的线性分类模型
算法是基于随机梯度下降法的对损失函数的最优化算法，有原始形式和对偶形式。
算法简单且易于实现。原始形式中，首先任意选取一个超平面，然后用梯度下降法不断极小化目标函数。在这个过程中一次随机选取一个误分类点使其梯度下降。
感知机学习算法是误分类驱动，采用随机梯度下降。
当训练数据集线性可分时，感知机学习算法是收敛的。且在训练数据集上的误分类次数 $\leq (\frac{R}{\gamma})^2,$ 其中 $R =$ max $||\hat{x_i}||,\gamma\leq y_i(w_{opt} \cdot x+b_{opt})$
当训练数据集线性可分时，感知机学习算法存在无穷多个解，其解由于不同的初值或不同的迭代顺序而可能有所不同。
当训练集线性不可分时，算法不收敛，迭代结果发生震荡

2.假设函数

$f(x)=\operatorname{sign}(w \cdot x+b)$ 其中， $\cdot x是w和x的内积，sign是符号函数：当x\geq 0时为1，反之为0$

3.损失函数

$b)=-\sum_{x_{i} \in M} y_{i}\left(w \cdot x_{i}+b\right)$

4.算法的原始形式

输入：训练集 $T=\lbrace(x_1,y_1),(x_2,y_2),……,(x_m,y_m)\rbrace,x\in R^n,y_i \in \lbrace -1,+1\rbrace,学习率:\eta(1<\eta \leq 1)$
输出：感知机参数 $w,b和感知机模型f(x)=\operatorname{sign}(w \cdot x+b)$
实施过程：
$\qquad$ (1) 选择初值 $w_0,b_0$
$\qquad$ (2) 在训练集选取数据 $x_i,y_i)$
$\qquad$ (3) 如果 $y_i(w \cdot x_i+b)\leq0,更新w和b：$ $w:=w+\eta y_i x_i,\qquad b:=b+\eta y_i$ $\qquad$ (4) 回到(2)，直至训练集没有误分类点

5.算法的对偶形式

输入：训练集 $T=\lbrace(x_1,y_1),(x_2,y_2),……,(x_m,y_m)\rbrace,x\in R^n,y_i \in \lbrace -1,+1\rbrace,学习率:\eta(1<\eta \leq 1)$
输出：参数 $\alpha,b$ 和感知机模型 $f(x)=\operatorname{sign}(\sum_{j=1}^{N}\alpha_jy_jx_j \cdot x+b)$ ，其中 $\alpha=(\alpha_1,\alpha_1,……,\alpha_m)^T$
实施过程：
$\qquad$ (1) 初始化 $\alpha$ 和 $b$ 趋于 $0$
$\qquad$ (2) 在训练集选取数据 $x_i,y_i)$
$\qquad$ (3) 如果 $y_i(\sum_{j=1}^{N}\alpha_jy_jx_j \cdot x+b)\leq0$ ,更新 $\alpha_i和b：$ $\alpha_i:=\alpha_i+\eta,\qquad b:=b+\eta y_i$ $\qquad$ (4) 回到(2)，直至训练集没有误分类点
注意：对偶形式中训练实例以内积的形式出现，为了方便，可预先计算训练集实例之间的Gram矩阵， $G=[x_i \cdot x_j]_{m\times m}$
Gram矩阵计算举例：
如样本点为 $x_1,y_1)=((3,3)^T,1),(x_2,y_2)=((4,3)^T,1),(x_3,y_3)=((1,1)^T,0)$ ,则Gram矩阵为： $\begin{pmatrix}3& 3 \\4&3 \\ 1&1\\\end{pmatrix}\times\begin{pmatrix}3& 4&1 \\3&3&1\\\end{pmatrix}=\begin{pmatrix}18& 21 & 6 \\21 &25& 7 \\ 6&7&2\\\end{pmatrix}$

翔燕

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第二章--感知机---（2）

1.模型简介感知机是根据输入实例的特征向量xxx对其进行二类分类的线性分类模型算法是基于随机梯度下降法的对损失函数的最优化算法，有原始形式和对偶形式。算法简单且易于实现。原始形式中，首先任意选取一个超平面，然后用梯度下降法不断极小化目标函数。在这个过程中一次随机选取一个误分类点使其梯度下降。感知机学习算法是误分类驱动，采用随机梯度下降。当训练数据集线性可分时，感知机学习算法是收敛的。且...
复制链接

扫一扫

专栏目录