![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Text Recognization
文本检测踩坑
Tianlong Lee
CASIA博士生在读,感兴趣方向为类脑智能、计算机视觉、大语言模型微调及安全
展开
-
CRNN原理详解、代码实现及BUG分析
CRNN原理及实现原文链接:An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition近期了解了一下文本识别,在CRNN的学习过程,包括CRNN原理、CTC Loss、代码实现、bug调试等问题也进行了一些调研,将自己的一些看法尽可能简洁地总结记录下来,如有错误,欢迎指出。CRNN使用CNN提取图像特征,RNN进行序列原创 2020-07-06 01:41:50 · 12794 阅读 · 2 评论 -
warp-CTC安装踩坑:make与install步骤出错解决方案
warp-CTC安装踩坑最近了解了下crnn+ctc,pytorch版本大于1.0自带ctc_loss,但是低版本的pytorch需要自己配置warpctc环境,开始用pytorch(1.3.0)自带的CTCLoss,总是莫名其妙的获得nan的梯度,看了一下知乎大佬们的分享,似乎也有人遇到了这个问题,作为只想完成任务的我果断换了warp-ctc。如果torch自带的没有问题,在使用时应该注意二者的传入参数是不一样的,如果使用torch自带的ctcloss,在传入网络输出概率时,应先进性log_soft原创 2020-07-02 08:48:56 · 4070 阅读 · 2 评论