CTC
努力喽
这个作者很懒,什么都没留下…
展开
-
CTC在语音识别上的应用,loss为nan的处理
ctc在pytorch1.2以上的版本中有集成好的是实现。torch.nn.functional.ctc_loss原理不再介绍,有很多开源的实现。主要说一下自己遇到的问题。在语音上应用时,会遇到loss为nan的情况,如果代码在交叉熵损失或者其他损失的情况下可以正常跑,说明数据没问题。主要原因出在对齐上。在一个batch中一条发音可能比较短,对应的目标文本也比较短,ctc就无法对齐,就会出现loss为Inf,后面就体现为nan。网上找了很多解决方法,都是针对数据的,但是其实torch.nn.fu原创 2020-12-02 14:59:40 · 1585 阅读 · 3 评论 -
Pytorch的ctc解码实现
在github上看到一个很好的ctc解码实现,暂时还没用。附上链接:pytorch的ctc解码实现作者在readme里对代码的参数的介绍的很清楚,就不搬运翻译了,可以直接看。在pytorch上CTC的安装:pytorch上CTC安装...原创 2020-11-02 10:49:16 · 2133 阅读 · 0 评论