CTC loss 博客转载

论文地址:

https://www.cs.toronto.edu/~graves/icml_2006.pdf

为了对应这个图,我们假设一种符合的模型情况:

英文OCR,37个类别(26个小写字母+10个汉字+空格),最大输出长度8个字符

模型预测结果是8*37的大小,换句话说就是,预测出来了8个字符,每个字符的37个类别的概率。

这时候我们就可以填表了,表中每个圆圈都是概率值,第一行第一列的数值就是,字符1是类别空格的概率,第二行第一列的数值就是,字符1是类别a的概率。

合法路径不唯一;优化目标是最大化“所有合法路径概率的和”。

(一个合法路径就是一种预测结果为正确的情况,每一个合法路径上的概率相乘就是这个路径的概率。)

采用递归的方式计算这个概率和,递归表格中每个元素该怎么求,后续补充

优秀博客:

CTC Loss 数学原理讲解:Connectionist Temporal Classification-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值