感知机与BP神经网络
一、感知机原理
感知机是二分类的线性模型,其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型。
假设训练数据集是线性可分的,感知机学习的目标是求得一个能够将训练数据集正实例点和负实例点完全正确分开的分离超平面。如果是非线性可分的数据,则最后无法获得超平面
二、感知机的几何解释
可以把感知机看成n维实例空间的决策超平面:W*X=0.这个超平面将空间中的点分为正负两类。如果给定的杨莉集线性可分,则可以将每个样例准确地分为两类,称为分类超平面。而其中(w1,w2,…,wn)为这个超平面的法向量,w0称为截距。
2.1点到线的距离
直线方程为Ax+By+C=0Ax+By+C=0,
点P的坐标为(x0,y0)(x0,y0)。
d=Ax0+By0+C / √A2+B2
2.2样本到超平面距离
我们假设超平面是h=w⋅x+b ,其中w=(w0,w1,…wm) ,x=(x0,x1,…xm),样本点x′到超平面的距离如下:
d=w⋅x′+b / ||w||
2.3超平面(Hyperplanes)
超平面是在空间R^d
中的一个子空间R^d−1。
在2维空间中的超平面是一条