进入第二季之后,开始熟悉第二季的平台,在延续了第一季的算法后,在大数据上约取得了4%的F1值,itemCF是在map-reduce下完成,统计模型是
基本在基于odps的sql操作表级下完成
之后转战回归模型
这里先回忆一下回归模型的基础:
谓LR分类器(Logistic Regression Classifier),并没有什么神秘的。在分类的情形下,经过学习之后的LR分类器其实就是一组权值w0,w1,...,wm.
当测试样本集中的测试数据来到时,这一组权值按照与测试数据线性加和的方式,求出一个z值:
z = w0+w1*x1+w2*x2+