Winnow
本文介绍mahout中的winnow算法
What is winnow?
线性分类器(二分类问题)
Steps
(1) 初始化权值矩阵w1,...wn为1(n为样本的属性个数)
(2)计算每个样本i的Vi=w1*xi1+w2*xi2+...
(3)如果样本的Vi大于等于a(通常取值为n或者n/2), 则认为样本的类别为1, 否则为0
(4)如果样本被正确分类,则什么都不做
如果样本类别为0, 而被预测为1, 则让权值*(1+e),此时认为样本i的属性值都为1
如果样本类别为1,而被预测为0, 则让权值/(1+e),此时认为样本i的属性值都为1
直到样本都被遍历完。
分类器构造完。