1、下午读了facebook CTR模型的论文,里面的第二章,主要讲实验设置方面的内容,评价指标的选择,涉及到两个,第一个是NE,normalized entropy,分子实际上就是logistic regression的损失函数,分母就是平均的损失,平均的损失实际上就等于整个数据集的entropy,所以叫normalized entropy,这种是消除了不平衡数据集的影响,第二个评价指标是Calibration,这个比较简单,就是预测点击数除以实际点击数,对于点击率预测,最关心的是点击率预测的准确性,而不太注重ROC这种rank order指标
2、上午查了那些疑似欺诈的人,把他们所在地域加入了黑名单地域,查了一些相关人员的资料,但我还是比较难以分辨对方是真实存在的个体,还是欺诈团伙用的诸多小号
星期五主要就是干的这两个事情