前言
最近看了下在线学习FTRL的相关东东,对其背后的理论知识梳理下。
假设loss 函数为 f(x) ,其中 ft(xt) 表示第 t 轮数据,在第
xt+1=argminx∑t=1tft(x)
主要求证一个问题,上面这个取参数的策略在什么情况下有效?为什么有效?
1 评估函数 Regret
假设loss 函数为 f(x) ,其中 ft(xt) 表示第 t 轮数据所对应的loss函数。
那么,经过T轮数据后,每轮的损失叠加到一起,表示为:
假设,有个全局最理想的参数 x∗ ,其对应的T轮数据后的,损失叠加到一起表示为: ∑Tt=1ft(x∗)
那么预测模型的经过T轮数据的损失总和与最理想状态的损失之和的差表示为:
Regret(x∗,ft)=∑t=1Tft(xt)−∑t=1Tft(x∗)=∑t=1Tft(xt)−f1:T(x∗)
我们通常用 Regret(x∗,ft) 来衡量预测模型的好坏,可以看到,其差是越小越好。
长远来看,平均的误差:
limT−>+∞Regret(x∗,ft)T
2 Regret Bound
在loss函数和regular函数 ,(及其他约束函数) 选取得当的情况, Regret是有上限的。
这里先给出Regret的两个上限,再然后予以证明。
1) General FTRL Bound
假设 rt使得h0:t+ft+1=r0:t+f1:t+1是1−strong−convexw.s.t||⋅||(t−1)
Regret(x∗,ft)≤r0:T−1(x∗)+12∑t=1T||gt||2(t−1),∗
2) FTRL - Proximal Bound
假设 rt使得h0:t=r0:t+f1:t是1−strong−convexw.s.