几何间隔相对于函数间隔的一个区别就是它不受参数( 和 )缩放影响,所以在SVM 这种优化目标是点到超平面之间的间隔的模型中,采用的是几何间隔。(如果采用函数间隔,学习过程会不断的产生更大的 和 ,根本停不下来)
但是感知机的目标是使误分类的点的个数为0,加不加对的正负判定毫无影响。相对的,采用几何间隔反而会使学习过程复杂化。推导如下:
若忽略 ,参数的更新如下:
若不忽略 ,参数的更新如下:
可见,若不省略,每次需要进行很复杂的求导,所以通常直接省略,减少计算量。
几何间隔相对于函数间隔的一个区别就是它不受参数( 和 )缩放影响,所以在SVM 这种优化目标是点到超平面之间的间隔的模型中,采用的是几何间隔。(如果采用函数间隔,学习过程会不断的产生更大的 和 ,根本停不下来)
但是感知机的目标是使误分类的点的个数为0,加不加对的正负判定毫无影响。相对的,采用几何间隔反而会使学习过程复杂化。推导如下:
若忽略 ,参数的更新如下:
若不忽略 ,参数的更新如下:
可见,若不省略,每次需要进行很复杂的求导,所以通常直接省略,减少计算量。