![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OCR论文阅读
文章平均质量分 89
记录OCR论文阅读笔记
陈壮实的搬砖生活
软件工程渣硕一个,移动开发死粉(目前仅会android),OCR、AIGC爱好者,欢迎和大家交流
展开
-
论文详读《SegCTC: Offline Handwritten Chinese Text Recognition via Better Fusion between Explicit and Im》
手写中文文本识别(HCTR)仍然是一个具有挑战性且未解决的问题。现有的识别方法主要分为两类:显式与隐式分割方法。显式分割识别方法使用显式的字符位置信息来训练识别器。然而,基于伪标签的常用弱监督训练策略使得对于困难字符样本难以获得有效的监督训练。相比之下,隐式分割识别方法使用所有的文本注释进行监督训练,但由于缺乏字符位置的显式监督信息,容易出现对齐问题。为了充分利用显式和隐式分割方法的互补性,我们提出了一种新的方法,SegCTC,更好地将这两种方法整合到一个统一的、更强大的识别器中。原创 2024-03-02 15:48:45 · 840 阅读 · 0 评论 -
翻译论文《Robust End-to-End Offline Chinese Handwriting Text Page Spotter with Text Kernel》
离线中文手写文本识别是模式识别领域长期存在的研究课题。在以往的研究中,文本检测和识别是分离的,这导致了文本识别高度依赖于检测结果。在本文中,我们提出了一个鲁棒的端到端中文文本页面检测器框架。它将文本检测和文本识别与文本内核相结合,集成了全局文本特征信息,从多个尺度上优化识别,降低了检测的依赖性,提高了系统的鲁棒性。我们的方法在CASIA-HWDB2.0-2.2数据集和ICDAR-2013比赛数据集上取得了最先进的结果。原创 2023-03-23 22:39:45 · 355 阅读 · 0 评论 -
论文阅读《Robust End-to-End Offline Chinese Handwriting Text Page Spotter with Text Kernel》
(1)文本做的是文本识别(2)在以前的研究中,文本检测和识别是分离的。(3)本文设计了一个端到端的文本识别框架,它将文本检测和文本识别与文本内核相结合,集成了全局文本特征信息,从多个尺度上优化识别,降低了检测的依赖性,提高了系统的鲁棒性。(4)识别准确率的结果如下数据集行级页级99.12%99.03%ICDAR-201394.27%94.20%原创 2022-09-24 23:34:37 · 472 阅读 · 2 评论 -
论文详读《基于改进 LeNet-5 模型的手写体中文识别》
1)中文手写体识别困境中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题。(2)本文方法改进经典LeNet-5模型,提出LeNet-Ⅱ模型。利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;双路的作用两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像。通过对其进行特征融合,可以达到丰富特征图像多样性、提高识别准确率的目的。最后经过全连接层进行分类。(2)结果在中文数据集。.........原创 2022-07-31 17:26:57 · 2075 阅读 · 0 评论 -
代码理解:IMPROVING CONVOLUTIONAL MODELS FOR HANDWRITTEN TEXT RECOGNITION
(1) def easter_unit(old, data, filters, kernel, stride, dropouts):其结构图如下:(2)def Easter2():原创 2022-06-25 21:56:52 · 203 阅读 · 0 评论 -
论文详读:IMPROVING CONVOLUTIONAL MODELS FOR HANDWRITTEN TEXT RECOGNITION
首先,指出了CNN相比RNN在手写体上的识别性能更差;然后,提出了Easter2.0(由多层一维卷积、批量归一化、ReLU、Dropout、Dense Residual connextion、Squeeze-and-Excitation module(SE) 和CTC损失组成, 其中,SE模块改进了我们提出的CNN体系结构对全局上下文的访问);再然后,提出了一种简单的、有效的与HTR任务相关的数据增强技术"Tiling and Corruption (TACo)" ; 最后,我们的工作在只使用公开训练原创 2022-06-24 11:48:18 · 700 阅读 · 1 评论 -
《Attention-ocr-Chinese-Version-mas # ter》代码运行逻辑
运行逻辑train.pyStep1:prepare_training_dir准备训练参数的存储目录Step2:common_flags.create_dataset获取数据集2. 数据处理的走向 从tfrecord数据中获取到的数据: images: [batch_size, height, width, channels] labels_one_hot: [batch_size, seq_length, num_char_class], 如[32, 37, 5642] 因为原原创 2022-06-07 23:30:24 · 172 阅读 · 0 评论 -
《Attention-based Extraction of Structured Information from Street View Imagery》代码复现记录ing
0. 说明 本文主要记录自己在复现《Attention-based Extraction of Structured Information from Street View Imagery》论文代码的一些坑。1. 本人环境 (1)win10系统 (2)python3.6 (3)tensorflow1.15(gpu版本) 一定记得切换tensorflow的版本,要不问题就非常多。2. import 爆红解决 在上述环境下,import爆红有很多: (1)对于爆红1,原创 2022-05-19 19:09:09 · 532 阅读 · 0 评论 -
论文详解:Attention-based Extraction of Structured Information from Street View Imagery(基于注意力机制的街景图像信息提取)
0. 摘要 (1)该论文基于CNN、RNN和提出新颖的Attention建立的神经网络模型,在FSNS数据集上准确率达到84.2%,而之前最先进的方法的准确率为72.46%;另外,在Google的Street View 数据集上也表现良好。 (2)本论文的模型具有以下特点:更简单、更通用、更快速 (3)研究了不同深度的CNN特征提取器,权衡其速度和准确性1. 引言1.1 现状分析 (1)传统OCR侧重于从扫描文档中提取文本 (2)自然场景中提取文本更具有挑战性,其原因在于:自然场景容原创 2022-05-19 12:28:34 · 836 阅读 · 0 评论 -
基于Faster-RCNN的水书古籍手写文字的检测与识别-论文阅读
文章目录论文基本信息摘要引言1. 数据集2. 目标检测算法的选取3. 实验论文基本信息期刊: 厦门大学学报(自然科学版) 、北大核心影响因子: 0.77摘要Step1: 通过多种数据扩增方式(如:人工书写、图像合成、图像裁剪)获得了80个文字别类,共110610个带标签的字符样本;Step2: 将Faster-RCNN算法应用到水书古籍文字识别中,以上面的样本以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95%的平均识别率。引言介绍了很多目前的水书识别方法,本文主要原创 2022-05-10 15:34:00 · 3303 阅读 · 2 评论