OCR
文章平均质量分 64
文字识别相关
SongpingWang
计算机视觉相关--程序语言相关
展开
-
win10 PaddleOCR C++推理部署(CPU部署)
Windows10 下 PaddleOCR C++推理部署(CPU部署) cmake3.21, VS2019。原创 2021-12-21 09:43:30 · 3528 阅读 · 0 评论 -
OpenCV—python—OCR 通用表格自动校正与识别
文章目录一、表格检测与矫正二、表格轮廓提取三、移除红色印章水印四、demo.py附:OCR个人见解各位好!今天写这个是只是用opencv的形态学来处理表格,并获取表格中的文本。一、表格检测与矫正以下 Extract_Rotate.py 的函数详解:__Duplicate_elements__ 主要用来统计重复元素。__four_point_transform__ 是重写了imutils....原创 2019-09-29 11:30:57 · 7398 阅读 · 10 评论 -
OpenCV—python OCR文本检测
文章目录一、形态学文本区域检测二、MSER+NMS文本区域检测2.1 MSER2.2 NMS一、形态学文本区域检测图像形态学操作,包括膨胀、腐蚀基本操作,即可实现简单场景的文字检测。其中,“膨胀”就是对图像中的高亮部分进行扩张,让白色区域变多;“腐蚀”就是图像中的高亮部分被蚕食,让黑色区域变多。通过膨胀、腐蚀的一系列操作,可将文字区域的轮廓突出,并消除掉一些边框线条,再通过查找轮廓的方法计算...原创 2019-08-31 22:55:29 · 8854 阅读 · 11 评论 -
Tesseract-OCR 入门使用
文章目录一、Tesseract-OCR 安装二、测试以下只针对widows平台,linux下没有测试一、Tesseract-OCR 安装Tesseract-OCR遵循Apache 2.0 license开源协议。下载地址:https://digi.bib.uni-mannheim.de/tesseract/你也可以查看源码编译安装:https://github.com/tesseract...原创 2018-11-14 17:31:17 · 1674 阅读 · 1 评论 -
OCR文本检测模型—pixel_link
一、前言基于目标检测的文字检测模型:CTPN、SegLink、EAST等这些模型主要依赖于深度学习,可应用于自然场景中进行文字检测,其主要的实现步骤是判断是不是文本,并且给出文本框的位置和角度,如下图:现在:文字检测的经典模型:PixelLink(像素连接)只需要利用“分类”,就能实现对文本/非文本的判断,并同时给出文本框的位置和角度。github项目地址: https://github....原创 2019-08-26 13:32:07 · 2316 阅读 · 3 评论 -
基于深度学习(端到端)的OCR文字识别
开发环境 Anaconda | python3.6 + tensorflow/keras/pytorch该模型使用了 OpenCV 模块。依赖包版本需求:你可以使用 pip install 包名/ conda install 包名 安装依赖easydict==1.7tensorflow_gpu==1.3.0scipy==0.18.1numpy==1.11.1opencv_python...原创 2018-11-09 17:34:26 · 13094 阅读 · 8 评论 -
CRNN—(端到端)的OCR文本识别 paper
一、前言论文 Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks在这篇文章中,解决了在基于CRNN自然场景下图像的文本检测与识别的问题。我们提议同时本地化和统一的网络用单个向前通道识别文本,避免中间图像裁剪和特征处理重新计算、单词分离或字符分组。① 与现有方法相比,考虑到文本检测和识别作为...原创 2018-11-08 22:04:31 · 3998 阅读 · 0 评论 -
CRNN-基于序列的(端到端)图像文本识别
一、前言二、网络架构2.1 特征序列提取2.2. 序列标注2.3. 转录2.3.1 标签序列的概率2.3.2 无字典转录2.3.3 基于词典的转录2.4. 网络训练4. 总结一、前言在现实世界中,稳定的视觉对象,如场景文字,手写字符和乐谱,往往以序列的形式出现,而不是孤立地出现。与一般的对象识别不同,识别这样的类序列对象通常需要系...原创 2018-09-09 10:49:06 · 11620 阅读 · 2 评论 -
OCR文本检测模型—SegLink
文章目录一、SegLink模型的主要思想在自然场景中,例如灯箱广告牌、产品包装盒、商标等,要检测出其中的文字会面临着各种复杂的情况,例如角度倾斜、变形等情况,这时就需要使用基于深度学习的方法进行文字检测。该方法能在自然场景下较好地实现对文字的检测,但在CTPN中给出的文本检测效果是基于水平方向的,对于非水平的文本检测效果并不好,而在自然场景中,很多的文本信息都是带有一定的旋转角度的,例如用手机...原创 2019-08-23 22:29:01 · 2433 阅读 · 0 评论 -
OCR文本检测模型—EAST
文章目录一、EAST模型简介典型的文本检测模型一般是会分多个阶段(multi-stage)进行,在训练时需要把文本检测切割成多个阶段(stage)来进行学习,这种把完整文本行先分割检测再合并的方式,既影响了文本检测的精度又非常耗时,对于文本检测任务上中间过程处理得越多可能效果会越差。那么现在我们来学习又快、又准的检测模型。一、EAST模型简介本文介绍的文本检测模型EAST,便简化了中间的过...原创 2019-08-23 22:28:12 · 4355 阅读 · 1 评论 -
OCR文本检测模型—Pixel-Anchor
文章目录一、文本检测概述二、Pixel-Anchor 网络详解2.1、Pixel-Anchor网络结构2.2、像素级别语义分割模块(Pixel based Module)2.3、锚检测回归模块(Anchor based Module)2.4、后处理2.5、Pixel-Anchor检测效果2.6、总结一、文本检测概述文本检测方法主要分为两类,这两种方法的优劣如下:基于像素级别的图像语义分割方...原创 2019-08-23 22:26:55 · 1997 阅读 · 0 评论 -
OCR文本检测模型—CTPN
文章目录一、CTPN简介二、CTPN检测流程三、小结一、CTPN简介一个简单的文字识别流程如下:Step 1. 通过手机、摄像机、扫描仪等设备采集含有待识别字符的图像,作为输入;Step 2. 对图像进行尺寸缩放、明暗调整、去噪等预处理操作;Step 3. 将图像中的单个字符、或者是连续几个字符所在的区域检测出来;Step 4. 根据文本检测结果从图像中将文本所在区域分割出来,然后导...原创 2019-08-23 22:27:22 · 2805 阅读 · 0 评论 -
Tesseract-OCR 字库训练
一、环境搭建安装Tesseract-OCR自带下载中文字库进行识别!但是在实际使用识别效果不佳,为了提高识别效果所以决定根据所需要的识别的内容训练字库!字库的训练最好在Tesseract-OCR的安装目录下进行。1、下载Tesseract-OCR引擎:使用详情请点击。2、jTessBoxEditor 下载:https://www.softpedia.com/get/Multimedia/...原创 2019-08-23 16:02:39 · 2099 阅读 · 2 评论 -
OCR综述—持续更新
整个OCR就是:文本检测、文本识别是其中两个关键环节目前OCR的应用场景主要分为以下三个方面:1、自然场景下多形态文本检测与识别2、手写体文本检测与识别3、文档的文本检测与识别(版面分析等)OCR目前的技术综述以及文献一、文本检测CTPN(基于Faster RCNN):目前比较成熟的文本检测框架,精确度较好。但是检测时间较长,有很大的优化空间。【文献】Detecting T...原创 2019-08-23 16:15:20 · 2119 阅读 · 0 评论