写在前面:
在友人的推荐下,开始入李航老师的坑,《统计学习方法》。
读到第二章,感知机,李航老师由浅入深让我有了很好的理解,现在自己总结一下思路。
正文:
感知机用于二分类问题,由浅开始:假定我们有一个平面上存在许许多多的蓝色点和红色点,并且假设存在一条直线可以将蓝红两色的点分隔在直线两侧(即书中所说的数据线性可分)。我们如何找到一条这样的直线y=wx+b呢?
同理:将这个问题推广到n维空间中,在空间若存在两组不同的特征点,我们是否能找到一个超平面来将这两组截然不同的目标分隔在超平面两端呢?
由上述的问题,便引出了感知机这样的二分类模型。我们设定用于分隔数据的直线(超平面)表达式为y=wx+b(在二维平面中,w、b为一个数;而在n维平面中w为数组,b还是一个数),我们将直线一侧的数据分类结果表示为1,另一侧我们用-1来表示。很自然的,我们引出符号函数:
按照李航老师的思路,统计学习路线为:模型→策略→算法,我们先提出模型:
感知机的模型我们定义为: