文字识别
文章平均质量分 95
落花逐流水
从事人工智能,模式识别与智能系统
展开
-
CTC Loss原理及实现
1、CTC 主要解决的问题CTC Loss要解决的问题就是当label长度小于模型输出长度时,如何做损失函数。一般做分类时,已有的softmax loss都是模型输出长度和label长度相同且严格对齐,而语音识别或者手写体识别中,无法预知一句话或者一张图应该输出多长的文字,这时做法有两种:seq2seq+attention机制,不限制输出长度,在最后加一个结束符号,让模型自动和gt label对齐;另一种是给定一个模型输出的最大长度,但是这些输出并没有对齐的label怎么办呢,这时就需要CTC loss原创 2021-05-17 19:07:25 · 3187 阅读 · 0 评论 -
Pytorch crnn 笔记(三)
本想自己从头写起,查了一下有人实现过,那我就只剩验证和改善的工作了。参考博客:Pytorch模型部署 - Libtorch(crnn模型部署)Step1: 模型转换将pytorch训练好的crnn模型转换为libtorch能够读取的模型.#covertion.pyimport torchimport torchvisonmodel = CRNN(32, 1, len(keys.alphabetEnglish) + 1, 256, 1).cpu()state_dict = tor原创 2020-11-04 21:42:47 · 583 阅读 · 6 评论 -
pytorch crnn 笔记(二)
crnn的论文、原理,训练等。CRNN论文地址:http://arxiv.org/abs/1507.05717(作者是华中科技大学的老师)代码:https://github.com/Sierkinhane/crnn_chinese_characters_rec论文阅读:摘要:基于图像的序列识别一直是计算机视觉领域的一个长期研究课题。本文研究了场景文本识别问题,这是在基于图像的序列识别中最重要和最具挑战性的任务之一。提出了一种新的神经网络结构,将特征提取、序列建模和转录集成到一个统一的框架原创 2020-10-12 22:44:27 · 1072 阅读 · 0 评论 -
pytorch crnn笔记(一)
最近在看ocr识别,就尝试了一下pytorch的crnn。https://github.com/meijieru/crnn.pytorch有一个lmdb库原来没有安装,网上参考的安装办法大多都是:conda install -c conda-forge python-lmdb我尝试用这种方法安装,还是安装失败,主要可能是找不到这个库,或者下载不下来。我的解决办法是下载下来本地安装。从https://conda.anaconda.org/conda-forge/win-64/下载p.原创 2020-09-26 17:17:51 · 1069 阅读 · 0 评论