合页损失:
lh(z,W)=max(0,1−ywTk⋅x)
其中 z=(x,y,k) , W 是多任务学习的权重,
对于二维的情况,我们很容易画出其函数。而且 max 函数是分段平滑函数构成,因此我们只需要求解各个分段平滑函数的导数即可:
当 1−ywTk⋅x>0 时,
∂l(w)∂w=−yx
当 1−ywTk⋅x<0 时,
∂l(w)∂w=0
当 1−ywTk⋅x=0 时,存在很多次梯度,因为点 x 是两个分段平滑函数的交点,而我们只需要计算一个次梯度,因此我们可以将其规划为上面任意一个公式即可。
即有:
∂l(w)∂w={−yx0if 1−ywTk⋅x>0if 1−ywTk⋅x≤0
或:
∂l(w)∂w={−yx0if 1−ywTk⋅x≥0if 1−ywTk⋅x<0
参考文献:
http://blog.csdn.net/raby_gyl/article/details/52077317