基于图像的序列识别:场景文字,手写字符和乐谱。这些都是以序列的形式出现,而不是孤立的出现。另外这些都是长度可变的。
以往的方法是先把序列切割成单个字符,然后用DCNN分别检测这些字符
优点:
1.直接从序列标签中学习,不需要详细的标注
2.直接从图像数据学习信息,不需要手工特征也不需要预处理(比如二值化等)
3.具有RNN相同性质,能够产生一系列标签
4.对序列对象的长度无约束,只需要在训练阶段和测试阶段对高度进行归一化
基于图像的序列识别:场景文字,手写字符和乐谱。这些都是以序列的形式出现,而不是孤立的出现。另外这些都是长度可变的。
以往的方法是先把序列切割成单个字符,然后用DCNN分别检测这些字符
优点:
1.直接从序列标签中学习,不需要详细的标注
2.直接从图像数据学习信息,不需要手工特征也不需要预处理(比如二值化等)
3.具有RNN相同性质,能够产生一系列标签
4.对序列对象的长度无约束,只需要在训练阶段和测试阶段对高度进行归一化