论文名称和地址:
Visualizing the Loss Landscape of Neural Nets
https://arxiv.org/pdf/1712.09913.pdf
1.1 背景和动机
作者主要想研究几个问题:
为什么我们能够最小化高度非凸神经损失函数?
为什么得到的最小值这个结果具有泛化性?
论文名称和地址:
Visualizing the Loss Landscape of Neural Nets
https://arxiv.org/pdf/1712.09913.pdf
作者主要想研究几个问题:
为什么我们能够最小化高度非凸神经损失函数?
为什么得到的最小值这个结果具有泛化性?