深度学习常见面试问题及回答 1.梯度下降过程中,为什么负梯度方向是下降最快的方向?2.Batch Normalization的主要作用,以及如何实现的?3.Relu的引入起到了什么作用,如何体现? 1.梯度下降过程中,为什么负梯度方向是下降最快的方向? 链接: link. 2.Batch Normalization的主要作用,以及如何实现的? 链接: link. 3.Relu的引入起到了什么作用,如何体现? 链接: link.