机器学习经典算法之感知机与支持向量机

最新推荐文章于 2023-01-01 15:50:24 发布

啦啦啦12345678900000000

最新推荐文章于 2023-01-01 15:50:24 发布

阅读量398

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/ZHANGJING199402/article/details/105018699

版权

感知机

属于二分类的线性判别模型，是神经网络与支持向量机的基础。

基本公式： $f (x) = s i g n (w x + b)$

样本类别标签为 $\in \{+1,-1\}$

损失函数：

若将误分类的总数作为损失函数，不是参数 $w, b$ 的连续可导函数，不易优化。误分类样本点到超平面的总距离 $-\frac{1}{\left\|w\right\|}\sum_{x_i\in M}y_i(wx_i+b)$ ，不考虑 $\frac{1}{\left\|w\right\|}$ ， $L(w,b)=-\sum_{x_i\in M}y_i(wx_i+b)$ 便是感知机的损失函数，为 $w, b$ 的连续可导函数。对 $w$ 求导得 $-\sum_{x_i \in M}y_ix_i$ ，对 $b$ 求导得 $-\sum_{x_i \in M}y_i$ ，故 $w$ 和 $b$ 的更新公式为 $\leftarrow w+\eta y_ix_i$ ， $\leftarrow b+\eta y_i$ ，其中 $x_i,y_i)$ 为错分样本，感知机每次随机选取错分样本，因此得到的超平面不唯一，初值选取不同，也会导致超平面不相同。

可证，感知机算法的收敛性：若样本线性可分，经过有限次迭代，可得到一个完全划分正确的超平面。

对偶形式：

对偶形式的基本想法为，由原始形式的 $w$ 和 $b$ 的更新公式，将 $w$ 和 $b$ 表示为实例 $x_i,y_i)$ 的线性组合形式 $w=\sum_{i=1}^N\alpha_iy_ix_i,b=\sum_{i=1}^N\alpha_iy_i$ ，其中 $\alpha_i=n_i\eta$ ， $n_i$ 表示第 $i$ 个实例样本由于误分类而进行更新的次数。

对偶形式算法：输入:线性可分的数据集 $T=\{(x_1,y_1),(x_2,y_2),\cdots,(x_N,y_N)\}$ ,其中 $x_i\in R^n,y_i\in\{-1,+1\},i=1,2,\cdots,N$ ,学习率 $\eta(0<\eta\le 1)$ ;

输出： $\alpha,b$ ；感知机模型 $f(x)=sign(\sum_{j=1}^N\alpha_jy_jx_j\cdot x+b)$ ，其中 $\alpha=(\alpha_1,\alpha_2,\cdots,\alpha_N)$

(1) $\alpha \leftarrow0,b\leftarrow 0$

(2)在训练集中选取数据 $x_i,y_i)$

(3)如果 $y_i(\sum_{j=1}^N\alpha_jy_jx_j\cdot x+b)\le0$

最低0.47元/天解锁文章

啦啦啦12345678900000000

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习经典算法之感知机与支持向量机

感知机属于二分类的线性判别模型，是神经网络与支持向量机的基础。基本公式：f(x)=sign(wx+b)f(x)=sign(wx+b)f(x)=sign(wx+b)样本类别标签为y∈{+1,−1}y \in \{+1,-1\}y∈{+1,−1}损失函数：若将误分类的总数作为损失函数，不是参数w,bw,bw,b的连续可导函数，不易优化。误分类样本点到超平面的总距离−1∥w∥∑xi∈Myi(w...
复制链接

扫一扫

专栏目录