CRNN文字识别
要点:CNN+RNN+CTC
CNN:通过卷积操作,将h x w x c图像转换为1xTxC特征图。1为特征图的高,T为特征图的宽,C为特征图的通道数。以高度为32的特征图来说,出卷积层为,用4层池化层可将高度降低到2,再用一个核为2、pad为0的卷积即可将高度降为1。
RNN:RNN一般采用两层的双向LSTM,输入的序列长度为CNN卷积后特征的长度T,序列中每一个特征尺度为CNN卷积后的通道数C。那么,
(1)第一层LSTM输入数据的维度为(T,N,C),N为batchsize大小。第一层LSTM的
原创
2021-07-15 10:25:47 ·
2605 阅读 ·
0 评论