不考虑具体原理,单纯考虑作用的话,可以把μ-strongly convex和L-smooth看作是一对CP,这对CP可以将目标函数强行变成一个二次函数的样子,并且限制了梯度的最大最小变化速度,使得梯度下降变得可控(L-smooth定义了二次函数的上界和梯度的最大变化速度,
μ-strongly convex定义了二次函数的下界和梯度的最小变化速度)。
目标函数有了这样的性质,便可以很方便地对其进行收敛性分析,并证明该算法的收敛性。
所以总的来说,μ-strongly convex+L-smooth,有利于提高算法的表现,有利于分析算法的收敛性。
简单理解凸优化中μ-strongly convex和L-smooth
于 2021-07-05 12:25:14 首次发布