第2章 感知机

1.概述:感知机(perceptron)是二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1.感知机对应于输入空间(特征空间)中将数据进行划分的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行划分的分离超平面,导入基于误分类的损失函数,利用梯度下降对损失函数进行极小化,求得感知模型。感知机学习算法分为原始形式和对偶形式,是神经网络与支持向量机的基础。

2.感知机模型:

上图中,w和b是感知机模型参数,w叫做权值(weight),b叫做偏置(bias)。

3.感知机的几何解释:线性方程为w*x+b = 0。对应于特征空间R的一个超平面S,其中w是平面的法向量,b是超平面的截距。这个超平面将特征空间划分为两个部分。位于两部分的点(特征向量)分别被分为正负两类。因此,超平面S称为分离超平面。如下图所示:

4.感知机的学习策略:感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面。

5.感知机学习算法的原始形式:感知机学习算法是误分类驱动的,具体采用随机梯度下降法。

算法如下:

 

解:构建最优化问题:min

 按照算法求解w,b。η=1.

(1)取初值w_0=0,b_0=0

(2)对x_1=$(3,3)^{T},y_1(w_0*x_1+b_0) = 0 ,没有被正确分类,更新w,b。

w_1 = w_0+y_1x_1=(3,3)^Tb_1 = b_0 + y_1 = 1

得到线性模型:w_1·x + b_1 = 3x^{(1)}+3x^{(2)}+1

(3)对x_1,x_2,显然,y_i(w_1x_i+b_1)>0被正确分类,不修改w,b;

x_3=(1,1)^Ty_3(w_1x_3+b_1)<0,被误分类,更新w,b。

w_2 = w_1+y_3x_3,b_2=b_1+y_3=0

得到线性模型:w_2x+b_2=2x^{(1)}+2x^{(2)}

如此继续下去,直到w_7=(1,1)^3,b_7=-3

w_7x+b_7=x^{(1)}+x^{(2)}-3

对所有数据点y_i(w_7x_i+b_7)>0,没有误分类点,损失函数达到极小。

超平面为:x^{(1)}+x^{(2)}-3=0

感知机模型为f(x) = sign(x^{(1)}+x^{(2)}-3)

迭代过程如下表:

求解的迭代过程
迭代次数误分类点wbwx+b
0 000
1x_1(3,3)^{T}13x^{(1)}+3x^{(2)}+1
2x_3(2,2)^T02x^{(1)}+2x^{(2)}
3x_3(1,1)^T-1x^{(1)}+x^{(2)}-1
4x_3(0,0)^T-2-2
5x_1(3,3)^T-13x^{(1)}+3x^{(2)}-1
6x_3(2,2)^T-22x^{(1)}+2x^{(2)}-2
7x_3(1,1)^T-3x^{(1)}+x^{(2)}-3
80(1,1)^T-3x^{(1)}+x^{(2)}-3

 

 

6.感知机学习算法的对偶形式

解:按照算法

(1)取\alpha _i=0,i=1,2,3,b=0,\eta =1

(2)计算Gram矩阵:(这里的矩阵是:x_1,x_2,x_3两两内积得到)

G=\begin{bmatrix} 18 & 21&6 \\ 21& 25 & 7\\ 6& 7 & 2 \end{bmatrix}

(3)误分条件y_i\left \{ \sum_{j=1}^{N}\alpha _j y_j x_j \cdot x_i+b \right \}\leq 0

参数更新:\alpha _i\leftarrow \alpha _i+1,b\leftarrow b+y_i【书上给的是这个。这里参数b更新应使用b=\alpha \cdot y_i

(4)迭代。结果如下表:

迭代过程
k01234567
  x_1x_3x_3x_3x_1x_3x_3
\alpha _101111222
\alpha _200000000
\alpha _300123345
b010-1-2-1-2-3

(5)w=2x_1+0x_2-5x_3=(1,1)^T,b=-3

分离超平面:x^{(1)}+x{(2)}-3=0

感知机模型:f(x) = sign(x^{(1)}+x^{(2)}-3)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值