最近在OCR识别,用到了CTC loss。只能说爱你不容易啊。
1、CTC解决什么问题?
[1] Sequence to sequence learning
[2] Unsegmented real-valued input stream (一般用于语音与光符字体识别)
因为如果在ocr或者语音方面,寻求分割的方式解决识别问题,那是难上加难。 例如:分割难度大,成本高,错误率高
2、解决问题分几步?
[1
最近在OCR识别,用到了CTC loss。只能说爱你不容易啊。
[1] Sequence to sequence learning
[2] Unsegmented real-valued input stream (一般用于语音与光符字体识别)
因为如果在ocr或者语音方面,寻求分割的方式解决识别问题,那是难上加难。 例如:分割难度大,成本高,错误率高
[1