涉及到语音项目或者CRNN的LSTM等训练时,通常会用到CTCLoss,在使用低版本的pytorch的时候,一种用的是百度CTCloss,由于换了3090的卡,pytorch也强行升级到1.8版本,没办法和百度CTC兼容了,换回自带的from torch.nn import CTCLoss,
发现训练很久都没有预测内容。原来和百度CTC不同的是,pytorch自带的CTCloss的输入要经过log_softmax才可以。在训练时候网络的输出层加上
net(image).log_softmax()
问题解决。