凸: 指的是顺着梯度方向走到底就 一定是 最优解 。大部分 传统机器学习 问题 都是凸的。 非凸: 指的是顺着梯度方向走到底只能保证是局部最优,不能保证 是全局最优。深度学习以及小部分传统机器学习问题都是非凸的。