一.作者思路
作者是为了增强使用推荐系统的鲁棒性并以矩阵分解为例,一般增强鲁棒性的方式有adversarial training,它的原理是在模型参数上添加干扰来训练达到增加推荐系统鲁棒性的目的,但是adversarial training有一定的缺陷(在参数上加干扰不太现实),所以作者反其道行之,在adversarial training上使用“正向”干扰来增加推荐系统的鲁棒性。
故逐一介绍以下三个方面的内容:
- 推荐系统的矩阵分解相关内容;
- adversarial training
- adversarial poisoning training (APT)
1.使用矩阵分解的推荐系统
arg min U , V ∑ ( i , j ) ∈ Ω ( r i , j − U i V j T ) 2 + λ ( ∥ U ∥ F 2 + ∥ V ∥ F 2 ) (1) \arg \min_{U,V} \sum_{(i,j)\in \Omega}(r_{i,j}-U_iV_j^{\mathrm{T}})^2+\lambda(\|U\|_F^2+\|V\|_F^2) \tag 1 argU,Vmin(i,j)∈Ω∑(ri,j−UiVjT)2+λ(∥U∥F2+∥V∥F2)(1)
2.adversarial training
min θ R max Δ , ∥ Δ ∥ ≤ ϵ ( L ( D , θ R ) + λ a d v L ( D , θ R + Δ ) ) (2) \min_{\theta_R} \max_{\Delta,\|\Delta\|\leq\epsilon}(L(D,\theta_R)+\lambda_{\mathrm{adv}}L(D,\theta_R+\Delta)) \tag2 θRmin