任务简介
如图所示,数据集的X是一系列的属性值,Y是1或者-1,用感知机算法训练这样的分类模型,对于测试集这个分类模型能在Accuracy(准确率)、Precision(精确率)、Recall(召回率)、F1(F值)这4个指标上能尽可能的高
算法原理
感知机用以解决数据的二分类问题,例如输入为若干个n维的向量X及其对应的Y(+1或-1),算法目的就是找出最好的权值向量 W=[w1,w2,w3……,wn] W = [ w 1 , w 2 , w 3 … … , w n ] 以及一个偏置(阀值)b,使得 sign(X∗WT−b)==Y s i g n ( X ∗ W T − b ) == Y 对尽量多的输入是正确的,也就是能最好地将数据按照Y值分开。 令 w0=−b w 0 = − b ,