1. 什么是神经网络的长期依赖问题?
循环神经网络如果设计长度很深,经过前向传播误差,以及反向传播梯度,容易出现梯度消失或爆炸的问题,使得神经网络的优化变得困难。网络丧失了学习很久之前信息的能力。
2. 从数学推导的角度解释长期依赖问题。
对一个没有输入数据、激活函数以及输出数据的循环神经网络,前向传播过程:
h t = W h t − 1 = W t − t 0 h t − t 0 h_t=Wh_{t-1}=W^{t-t_0}h_{t-t_0} ht=Wht−1=Wt−t0ht−t0
当