深入浅出OCR
文章平均质量分 96
本专栏主要对深入浅出OCR系列技术介绍,内容共分为十二章,包括不限于论文解读、综述、理论总结及实战,额外推出OCR方向多个实战项目与面试题总结,(计算机视觉专栏不会更新实战,忘周知!),专栏内容可供CV方向学习者学习,后期结合NLP方向,目前正在整理材料阶段,后期OCR方向会在本专栏更新,欢迎订阅。
GoAI
CSDN人工智能领域博客专家、新星计划计算机视觉方向导师、内容合伙人。阿里云社区专家博主、百度飞桨PPDE、飞桨校领航团团长、开源特训营导师,曾获多次AI比赛奖项及大厂实习,长期专注大数据与人工智能知识分享,相关合作和交流可私信。
展开
-
最全AI领域知识星球:GoAI的学习社区
GoAI的学习社区知识星球是一个提供各方向资料整合的平台,致力于提供机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC各个大方向资料,对以上方向全面而有深度的**专栏内容、前沿论文解读、资料共享、行业最新动态以及实践教程。除此之外,后续会整理更多方向综述、重要论文、求职相关(简历撰写技巧、面试题总结、面经资料等)分享给大家,也会邀请更多嘉宾入驻,和大家一起分享职场工作、算法研究心得体会等等干货内容!原创 2024-03-05 11:00:00 · 1658 阅读 · 7 评论 -
CSDN首发 | 《深入浅出OCR系列》目录
恭喜你发现宝藏!本专栏系列主要介绍计算机视觉OCR文字识别领域,每章将分别从OCR技术发展、方向、概念、算法、论文、数据集、对现有平台及未来发展方向等各种角度展开详细介绍,综合基础与实战知识,欢迎大家订阅交流。以下是本系列目录,分为前置篇、基础篇与进阶篇,进阶篇在基础篇基础上进行全面总结,会针对最经典论文及最新算法展开讲解,内容目前包括不限于文字检测、识别、表格分析等方向。原创 2023-03-12 12:29:19 · 12488 阅读 · 36 评论 -
OCR入门教程系列(一):OCR基础导论
📝导读:本系列主要介绍计算机视觉领域OCR文字识别领域技术发展方向,面向深度学习同学,内容总计五章,每章将从OCR技术发展、概念、方法等各种角度展开详细介绍。第一篇介绍OCR概念及发展以及相关数据集,其次列出几种常见的OCR文本检测与文本识别技术,文章最后分享几种开源的OCR平台,后续系列文章将继续介绍OCR相关技术及实战演练。原创 2022-04-01 21:38:27 · 87149 阅读 · 65 评论 -
《深入浅出OCR》前言知识(一):机器学习最新全面总结
经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,**对标最全OCR教程**,具体章节如导图所示,将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开详细介绍。面向对象:本篇前言知识主要介绍机器学习,方便小白或AI爱好者学习基础知识。原创 2023-08-24 11:17:33 · 6113 阅读 · 7 评论 -
《深入浅出OCR》前言知识(二):深度学习最新全面总结
本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程。将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开详细介绍。本篇为该专栏的前言知识,主要介绍深度学习知识,全面总结知知识点,方便小白或AI爱好者学习基础知识。原创 2023-08-29 09:11:03 · 5146 阅读 · 4 评论 -
《深入浅出OCR》第八章:文档处理多模态预训练
本文为《深入浅出OCR》系列第八章,《OCR文档任务多模态预训练模型总结》主要介绍OCR文档任务的多模态模型的经典论文及内容结构展开介绍。大模型时代的现实场景或者企业私域数据中,大多数数据都以文档的形式存在,如何更好的解析获取文档数据显得尤为重要。文档智能也从以前的目标检测(版面分析)阶段转向多模态预训练阶段。原创 2024-02-12 10:00:00 · 364 阅读 · 0 评论 -
《深入浅出OCR》第七章:文本识别后处理
本章将介绍常见的文字识别后处理方法,按照不同的目的将内容分为两部分:文本纠错和文本结构化。文本纠错的目标是纠正OCR输出文本中错误的文字,而文本结构化则是从OCR输出文本中定位需要的信息,并按照应用要求组织成特定的结构,方便小白或AI爱好者快速了解OCR方向知识.原创 2023-12-27 11:00:05 · 1181 阅读 · 0 评论 -
《深入浅出OCR》第六章:OCR数据集与评价指标
本篇为《深入浅出OCR》第六章:OCR数据集与评价指标,主要介绍OCR数据集(规则与不规则、合成数据集)、数据生成、OCR数据评估指标等知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识.原创 2023-12-05 10:00:00 · 1246 阅读 · 0 评论 -
《深入浅出OCR》实战:基于PGNet的端到端识别
本篇导读:在上一章【《深入浅出OCR》第五章:端到端文字识别】,本人着重介绍端到端识别算法的发展、分类及各自领域经典算法,为了进一步熟悉端到端识别流程,本次作者将以基于PGNet的端到端识别实战为例,全面对端到端识别技术流程进行解读,方便学习者快速上手实战。原创 2023-11-20 13:30:00 · 1243 阅读 · 0 评论 -
《深入浅出OCR》第五章:OCR端到端识别
上一章我们介绍到OCR流程包括两阶段算法和端到端算法,本篇为 **【《深入浅出OCR》第五章:端到端识别】,主要对深度学习端到端识别方法进行介绍**,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。原创 2023-11-14 14:00:00 · 1174 阅读 · 2 评论 -
《深入浅出OCR》实战:基于CRNN的文字识别
本篇导读:在上一章【《深入浅出OCR》第四章:OCR文字识别】,本人着重介绍文字识别算法的发展、分类及各自领域经典算法,为了进一步熟悉文字识别流程,本次作者将以基于主流文字识别算法CRNN为例,全面对文字识别技术流程进行解读,方便学习者快速上手实战。原创 2023-11-01 00:44:31 · 1088 阅读 · 2 评论 -
《深入浅出OCR》第四章:OCR文字识别
在上一章我们介绍到OCR文字检测, 本篇为 **【《深入浅出OCR》第四章:OCR文字识别】,主要对深度学习OCR文字识别方法进行介绍**,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。原创 2023-10-24 19:18:06 · 1303 阅读 · 0 评论 -
《深入浅出OCR》实战:基于DBNet的文字检测
本篇导读:在上一章【《深入浅出OCR》第三章:OCR文字检测】,本人着重介绍文字检测算法的发展、分类及各自领域经典算法,为了进一步熟悉文字检测流程,本次作者将以基于DBNet的文字检测实战为例,全面对文字检测技术流程进行解读,方便学习者快速上手实战。原创 2023-10-20 11:19:20 · 1504 阅读 · 0 评论 -
《深入浅出OCR》第三章:OCR文字检测
上一章我们介绍到OCR流程包括两阶段算法和端到端算法,目前在通用场景识别效果下,两阶段OCR相比端到端OCR技术更成熟,所以工业界大多采用两阶段OCR。本篇为 【《深入浅出OCR》第三章:OCR文字检测】,主要对深度学习OCR文字检测方法进行介绍,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。原创 2023-10-17 21:13:13 · 2155 阅读 · 0 评论 -
《深入浅出OCR》第二章:OCR技术发展与分类
本篇为《深入浅出OCR》第一章:OCR技术导论主要介绍OCR的概念、分类、应用场景、技术流程、数据集等基础知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识。第二章将对OCR技术展开进一步详细介绍,欢迎大家关注!原创 2023-10-01 15:58:10 · 2132 阅读 · 1 评论 -
《深入浅出OCR》第一章:OCR技术导论
本篇为《深入浅出OCR》第一章:OCR技术导论主要介绍OCR的概念、分类、应用场景、技术流程、数据集等基础知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识,每章文末将有免费福利送上!下一章将对OCR技术展开进一步详细介绍,欢迎大家关注!原创 2023-09-19 13:51:02 · 3100 阅读 · 2 评论 -
【计算机视觉项目实战】中文场景识别
本篇导读:在上节深度学习知识总结,本人对手写识别项目进行实战,为了进一步学习计算机视觉知识,我们本次以计算机视觉的OCR方向为例,完成中文场景识别,从头到尾帮助大家学习并完成中文文字识别实战任务,方便学习者学习计算机视觉项目流程。原创 2023-09-07 12:23:48 · 4453 阅读 · 1 评论 -
OCR入门教程系列(二):OCR技术发展
导读:本文为本系列第二章,在上一章中,我们对OCR的概念、发展历程等做了详细解读,并介绍了几种OCR识别方法,本章将继续针对OCR文字识别进行详细讨论,通过不同的OCR分类识别数据集进一步介绍常用的几种OCR算法,对比传统OCR与深度学习OCR。首先是传统OCR识别方法,下面内容将从我国OCR研究历程开始展开。这篇文章将对OCR技术进行分类描述,我国OCR发展过程:我国的印刷体汉字识别研究是从上世纪70年代末起步的,至今己有近三十年的发展历...原创 2022-04-03 23:31:27 · 23882 阅读 · 0 评论 -
OCR入门教程系列(三):文字检测技术总结
📝导读:在本系列前两章内容中,主要介绍OCR的概念、发展及主流OCR技术介绍,本章将继续介绍深度学习在OCR方法的应用。首先回顾第一章的内容,文中提到OCR识别过程,大部分识别流程包括文字检测和文字识别部分,本章将对文字检测部分进行详细阐述。本系列目录:1️⃣OCR系列第一章:OCR文字识别技术总结(一)2️⃣OCR系列第二章:OCR文字识别技术总结(二)3️⃣OCR系列第三章:OCR文字识别技术总结(三)一、OCR文字识别方法发展二、文本检测概念介绍...原创 2022-04-06 09:45:01 · 12676 阅读 · 1 评论 -
OCR入门教程系列(四):文字识别技术总结
导读:在上一篇文章中我们对文字检测各类算法进行总结,本篇将继续介绍OCR领域文字识别理论部分的研究,将从规则文本及不规则文本的文字识别进行展开,主要介绍主流文字识别相关算法。原创 2022-04-09 11:23:10 · 14532 阅读 · 4 评论 -
OCR入门教程系列(五):OCR实战代码解析
OCR文本识别实战📝导读:在上一篇文章中我们对文字识别算法理论部分进行详细总结,本篇将继续介绍文字识别CRNN网络实战部分,下面将从CRNN实践代码出发进一步说明文字识别实战流程。本系列目录:1️⃣OCR系列第一章:OCR文字识别技术总结(一)2️⃣OCR系列第二章:OCR文字识别技术总结(二)3️⃣OCR系列第三章:OCR文字识别技术总结(三)4️⃣OCR系列第四章:OCR文字识别技术总结(四)5️⃣OCR系列第五章:OCR文字识别技术总结(五)......原创 2022-04-13 11:10:14 · 15708 阅读 · 1 评论 -
计算机视觉方向面试题总结(三):OCR篇
《计算机视觉面试题总结系列》 主要面向计算机视觉目标检测、图像分割及OCR等领域,将对该领域面试相关问题等进行总结,主要进行资源整合!学习对象主要面向深度学习CV方向同学,本篇主要对OCR方向进行全面总结,希望大家能够多多交流如有错误请大家在评论区指正,如有侵权联系删除。原创 2023-04-28 14:36:51 · 18723 阅读 · 11 评论 -
计算机视觉论文总结系列(三):OCR篇
本篇主要介绍OCR论文总结,主要从OCR论文、模型方法、论文链接进行全面总结介绍,重点论文已标注✨,部分内容取自本人专栏《深入浅出OCR》系列,上述内容后续会继续更新,欢迎大家订阅学习交流,感谢批评指正!原创 2023-04-14 13:51:23 · 19515 阅读 · 19 评论 -
计算机视觉竞赛技巧总结(三):OCR篇
本篇主要介绍OCR竞赛技巧总结,主要从OCR概念、分类、模型方法、推荐框架、常用trick、评估指标等多个方面进行总结介绍,部分内容取自本人专栏《深入浅出OCR》系列,上述内容后续会继续更新,欢迎大家订阅学习交流,感谢批评指正!原创 2023-04-12 11:39:36 · 19942 阅读 · 14 评论 -
【智慧交通项目实战】《 OCR车牌检测与识别》(一)项目介绍
💚导读:本项目为新系列【智慧交通项目实战】《OCR车牌检测和识别》(一),该系列将分为多篇文章展开分别对项目流程、数据集、检测、识别算法、可视化进行详细介绍,本篇为该系列第一篇,将着重介绍本次项目开源的CCPD车牌数据集,,用于本次车牌检测和识别模型算法开发,后续系列文章将陆续更新。原创 2023-05-30 16:35:14 · 14481 阅读 · 14 评论 -
【智慧交通项目实战】 《 OCR车牌检测与识别》(二):基于YOLO的车牌检测
💚导读:本项目为新系列【智慧交通项目实战】《OCR车牌检测和识别》(二)--基于YOLO的车牌检测,该系列将分为多篇文章展开分别对项目流程、数据集、检测、识别算法、可视化进行详细介绍。本篇为该系列第二篇,将着重介绍车牌检测流程,对环境安装、训练流程、配置进行详细解读,后续该系列文章将陆续更新。原创 2023-06-09 15:20:29 · 12135 阅读 · 5 评论 -
【智慧交通项目实战】 《 OCR车牌检测与识别》(三):基于改进CRNN的车牌识别
本项目为新系列【智慧交通项目实战】《OCR车牌检测和识别》(三)--基于改进CRNN的车牌识别,该系列将分为多篇文章展开分别对项目流程、数据集、检测、识别算法、可视化进行详细介绍。本篇为该系列第三篇,将着重介绍车牌识别流程,对环境安装、训练流程、配置进行详细解读,后续该系列文章将陆续更新。原创 2023-06-26 16:31:45 · 10597 阅读 · 5 评论 -
【智慧交通项目实战】《 OCR车牌检测与识别》(四):基于Pyqt的项目可视化
本项目为新系列【智慧交通项目实战】《OCR车牌检测和识别》(四)--项目可视化,该系列将分为多篇文章展开分别对项目流程、数据集、检测、识别算法、可视化进行详细介绍。本篇为该系列第四篇,将着重介绍车牌识别项目可视化,对Pyqt可视化界面、配置进行详进行详细解读,后续将陆续更新其他项目实战文章。原创 2023-07-03 14:51:15 · 9600 阅读 · 1 评论 -
【智慧交通项目实战】 《 OCR车牌检测与识别》(五):模型部署与优化
本项目为新系列 【智慧交通项目实战】《OCR车牌检测和识别》(五)--模型部署与优化》为该系列最后一篇,着重介绍车牌识别系统的模型部署与优化,后续其他系列文章将继续更新相关实战项目。原创 2023-07-13 18:28:08 · 8612 阅读 · 3 评论 -
OCR文字识别方法综述
摘 要:文字识别可以把海量非结构化数据转换为结构化数据,从而支撑各种创新的人工智能应用,是计算机视觉研究领域的分支之一,其任务是识别出图像中的文字内容,一般输入来自于文本检测得到的文本框截取出的图像文字区域。近几年来,基于深度学习的文字识别算法模型已取得不错成果,其过程无需进行特征处理且可以实现复杂场景文字识别,效果要优于传统文字识别方法,逐渐成为文字识别研究应用的主流方式。本文将主要介绍基于深度学习的文字识别技术综述,分类总结主流文字识别经典算法,讨论未来文字识别领域发展与研究趋势。关键词:OCR...原创 2022-07-05 11:59:47 · 11570 阅读 · 6 评论 -
OCR文字识别领域经典论文总结
本篇将介绍文字识别经典论文,内容包括文字检测、文字识别、端到端识别等方法,具体将分别对论文算法简介、思路、代码等几个部分展开介绍。目前各部分只举例经典论文,算法没有全部写完,后续会将在此部分基础上更新更多论文综述及代码实战部分。.................................原创 2022-06-05 09:01:46 · 15047 阅读 · 4 评论 -
OCR论文笔记系列(一): CRNN文字识别
本文主要介绍OCR领域经典深度学习方法CRNN+CTC,CRNN是一种卷积循环神经网络结构,用于解决基于图像的序列识别问题,特别是场景文字识别问题。CRNN网络结构包含三部分,从下到上依次为:1. 卷积层。作用是从输入图像中提取特征序列。2. 循环层。......原创 2021-12-08 14:45:47 · 26974 阅读 · 0 评论 -
OCR论文笔记系列(二): ASTER文字识别
本文主要主要介绍文字识别经典论文ASTER,其主要解决不规则排列文字的文字识别问题,论文为之前CVPR206的paper(Robust Scene Text Recognition with Automatic Rectification,方法简称为RARE)的改进版。1. 主要思路针对不规则文字,先矫正成正常线性排列的文字,再识别; 整合矫正网络和识别网络成为一个端到端网络来训练; 矫正网络使用STN,识别网络用经典的sequence to sequence + attention......原创 2022-02-19 10:30:26 · 5387 阅读 · 1 评论 -
OCR项目实战(一):手写汉语拼音识别(Pytorch版)
本项目基于深度学习的手写汉语拼音识别方法研究与实现。项目采用Pytorch框架,整体采用主流深度学习文字识别算法CRNN+CTC方法,项目流程主要分为数据集采集及标注,算法构建、模型训练、预测与评估等。原创 2023-02-19 16:11:50 · 8913 阅读 · 69 评论 -
Paddle进阶实战系列(四):基于PaddleOCR的体检报告识别
基于PaddleOCR已在文字识别领域取得优秀成果,本项目基于PaddleOCR实现体检报告检测与识别,对数据进行结构化处理,结合CV+NLP技术达到一定识别精度,未来推广应用场景可以基于识别信息做个性化疾病预测与健康推荐。...原创 2022-08-27 09:19:45 · 5427 阅读 · 11 评论 -
Paddle进阶实战系列(三):基于SVTR算法的手写英文单词识别
本项目以最新PaddleOCRv3为框架,采用最新的OCR领域算法SVTR,完成手写英文单词识别算法搭建。流程分为数据集构建、数据集处理、模型搭建与预测、推理等,数据集采用好未来教育提供的开源数据集,每张图片对应多个单词,相比传统单个手写数字识别具有一定难度。原创 2023-04-10 10:31:58 · 2736 阅读 · 9 评论 -
Paddle进阶实战系列(二):智慧交通预测系统
随着深度学习在近几年的快速发展,智慧交通出现许多不同方面应用,如车牌识别、交通标志检测与识别及综合应用的行人分析系统等。 本项目分为三部分,分别是交通流量预测、车牌识别、车辆检测等,采用热门百度开源框架--PaddlePaddle,其模型方便易上手且生态完善,目前在人工智能各领域取得不错效果,通过PaddleOCR和Yolo框架可分别实现车牌识别与车辆检测任务。原创 2023-01-15 10:00:00 · 5914 阅读 · 8 评论 -
Paddle进阶实战系列(一):保险文本视觉认知问答
针对保险文本视觉认知问答项目,本文使用paddle框架将OCR与NLP技术相结合,根据不同文档图片数据集进行OCR识别,对问题和回答进行建模 。原创 2023-01-10 11:23:33 · 5238 阅读 · 9 评论 -
Paddle入门实战系列(五):基于CRNN的手写英文单词识别
本项目采用PaddleOCR开源框架进行写英文单词识别,流程分为数据集构建、数据集处理、模型搭建与预测、推理等,数据集采用好未来教育提供的开源数据集,每张图片对应多个单词,相比传统单个手写数字识别具有一定难度,项目采用CRNN+CTC方法,设定相关参数值,实现不定长的手写英文单词识别。原创 2023-04-06 09:54:38 · 1523 阅读 · 8 评论 -
Paddle入门实战系列(五):渔船牌照识别
恭喜你发现宝藏!本专栏系列主要介绍计算机视觉OCR文字识别领域,每章将分别从OCR技术发展、方向、概念、算法、论文、数据集、对现有平台及未来发展方向等各种角度展开详细介绍,综合基础与实战知识。原创 2023-04-20 09:48:47 · 3559 阅读 · 6 评论