论文阅读------Stochastic Gradient Descent with Differentially Private updates
SGD
代价函数
对于不同批量数量不一的数据,使用相同的代价函数求和进行激励计算,具体的函数描述为: 1 n ∑ i = 1 n l ( w , x i , y i ) \frac{1}{n}\sum_{i=1}^n l(w,x_i,y_i) n1∑i=1nl(w,xi,yi)
正则化描述
使用范式对其进行正则化,分为 L 1 L1 L1正则化与 L 2 L2 L2正则化,于是对w进行正则化后得到的结果为:(使用的是 L 2 L2 L2正则化)
w ∗ = λ 2 ∣ ∣ w ∣ ∣ 2 + 1 n ∑ i = 1 n l ( w , x i , y i ) w^*=\frac{\lambda}{2}||w||^2+\frac{1}{n}\sum_{i=1}^n l(w,x_i,y_i) w∗=2λ∣∣w∣∣2+n1∑i=1nl(w,xi,yi)
这里的 λ \lambda λ为正则化参数, w ∗ w^* w∗为在损失函数约束下的 L 2 L2 L2正则化。
训练过程
目标是让代价函数最小,于是具体的过程为:
min ( 1 n ∑ i = 1 n l ( w , x i , y i ) ) \min(\frac{1}{n}\sum_{i=1}^n l(w,x_i,y_i)) min(n1∑i=1nl(w,x