遇到的问题记录:
这个错误的意思是在进行反向传播时,前面缓冲区里的计算图已经被释放了。在前向传播过程中每进行一次计算都会被加入到缓冲区的计算图中,而反向传播时,根据计算图中需要进行梯度传递的部分进行反向梯度计算。我遇到的这个问题是在同时迭代更新两个网络的过程。当第一个网络进行backward之后,相应的计算图就已经被释放了,而两个网络的训练损失有部分重叠,所以当第二个网络backward时,就会出现这个问题。
解决的方法是将重叠部分的损失进行重新计算用于第二个网络。注意两个网络的损失要分开计算,在计算过程中注意张量的使用。