为了缩短机器学习入门者看视频的时间,特意整理了精简的部分。
机器学习
1. 银行是否发贷款的模型,采用线性模型(现实中一般不会这么简单),当评分大于某规定值,则发放,否则,不发放;
输入量为x,属性个数为d,sign 是符号函数,threshold 即所说的规定值。本式通过机器学习w和threshold 来建立模型。通过h(x)的值决定是否发放贷款。w 通常称为权重,y通常称为标签。当精简符号表示时,将-threshhold 看成一个w0值,+1看成x0,则精简后的式子表示为:
如何找出合适的w?(修正)
看右边矢量图,线性模型可以看成w与x的内积运算,当w与x的夹角大于90°,则结果为负值,反之,为正值。
当发现某点真实y应为+1,模型输出-1,证明该点的x与y的夹角过大,如右上第一个图,此时可以通过w+yx进行修正w,则夹角变小,当真实y应为-1,模型输出为+1,证明该夹角过小,通过w+yx ,即w-x,修正w,将夹角变大。该修正方法也称为感知机学习算法(PLA)。常见的调整w方式为逐个循环,直到所有输入x,都能正常预测真实y停止。PLA停止条件为线性可分。当不能线性可分,就不能停止。
变形PLA-(贪心思想-口袋演算法)总是保存当前的最优w。并设置一个最大迭代次数。虽然不是线性可分,但是还可以找到比较好的w。