为什么感知机使用函数间隔作为损失函数(忽略1/||w||)

几何间隔相对于函数间隔的一个区别就是它不受参数( w 和 b )缩放影响,所以在SVM 这种优化目标是点到超平面之间的间隔的模型中,采用的是几何间隔。(如果采用函数间隔,学习过程会不断的产生更大的 w 和 b ,根本停不下来)

 

但是感知机的目标是使误分类的点的个数为0,加不加\frac{1}{||w||}-y(wx+b)的正负判定毫无影响。相对的,采用几何间隔反而会使学习过程复杂化。推导如下:

若忽略 \frac{1}{||w||} ,参数的更新如下:

w_{k}=w_{k-1} + \eta y_ix_i

b_{k}=b_{k-1} + \eta y_i

若不忽略 \frac{1}{||w||} ,参数的更新如下:

\frac{\partial }{\partial w}||w|| = \frac{w}{||w||}

w_{k}=w_{k-1} + \eta y_ix_i(\frac{I}{||w||}-\frac{ww^{T}}{||w||^{3}})+\eta y_ib_{k-1}(-\frac{w}{||w||^3})

b_{k}=b_{k-1} + \frac{1}{||w||}\eta y_i

可见,若不省略\frac{1}{||w||},每次需要进行很复杂的求导,所以通常直接省略,减少计算量。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值