FTRL
参考论文:Ad Click Prediction: a View from the Trenches
FTRL是一种在线学习的训练方法,是一种增量的学习方法,即可以保证训练的精度,又可以保证解的稀疏,非常适合大规模的LR在线训练。
FTRL的优化目标为:
wt+1=argminw(g1:tw+12∑s=1tδs∥w−ws∥22+λ1∥w∥1)
该目标函数可以改写为:
(g1:t−∑s=1tδsws)w+12∥w∥22+λ1∥w∥1
其中, zt−1=g1:t−1−∑ts=1δsws ,在第 t 轮迭代开始前,
wt+1
可以求解:
wt+1,i=0,if|zt,i|<λ1;−ηt(zt,i−sgn(zt,i)λ1),otherwise