ctcloss理解及ctcloss使用报错总结
ctcloss函数主要用在没有事先对齐的序列化数据训练上,比如语音识别,ocr识别等,主要的优点是可以对没有对齐的数据进行自动对齐。
-
L = a , o , e , i , u , b , p , m , f , ⋯ L={a,o,e,i,u,b,p,m,f,\cdots} L=a,o,e,i,u,b,p,m,f,⋯ 表示所有字符的集合。
-
π = ( π 1 , π 2 , ⋯ , π T ) , π i ε L π=(π_1,π_2,\cdots,π_T),π_i\varepsilon L π=(π1,π2,⋯,πT),πiεL 表示一条由L中元素组成的长度为T的路径,表示模型的输出序列。
-
l = ( l 1 , l 2 , ⋯ , l m ) , l i ε L l = (l_1,l_2,\cdots,l_m),l_i\varepsilon L l=(l1,l2