【时间】2019.08.03 【题目】凸优化和非凸优化 具体见:凸优化和非凸优化 为什么深度学习中往往要求损失函数是凸函数? 因为凸函数最终得到的解是全局最优解,非凸函数得到的可能是局部最优解,训练时可能不收敛。(个人理解)