文本检测
文章平均质量分 72
javastart
专注于大数据 AI
展开
-
paddleocr 问题清单
1.模型下载地址:https://github.com/future1314/PaddleOCR/blob/develop/doc/doc_ch/quickstart.md原创 2021-01-30 11:17:52 · 930 阅读 · 0 评论 -
PaddleOCR数字仪表识别——4. pipeline
本文链接:https://blog.csdn.net/Castlehe/article/details/108664008写给自己:服务器上启动时,jupyter notebook和streamlit都要切换到py37的环境下启动1. 考虑pipeline我现在是只弄好了一个文字识别模型,需要调用现有的 文字检测 模型,来确定文字区域,把区域图片输入到文字识别模型中。其实文档写得很清楚了,看看就知道了,主要有两个。PaddleOCR中文说明文档4.1 方式1 直接使用Padd...转载 2021-01-22 12:21:47 · 2065 阅读 · 1 评论 -
发票图像识别,如何提高识别率?
做的一个项目需要对发票图片做识别,理想情况下当然是能做到对手机拍摄的发票图片做识别,难度比较大,主要是发票套印套打严重,字体打印质量不高,全国发票格式多样不统一。开这个话题跟感兴趣的朋友交流。我觉得有两个难点:第一拍的照片是否对齐,没对齐怎么判断, 还有就是折叠影响,如何处理?第二个识别,这个上深度学习就行了,如果是机打发票没有手写的话要简单很多。19 人赞同了该回答不知道题主是否已经解决这个问题,恰好我也正在研究这方面的问题,以下是我的思路,希望能做到抛砖引玉的效果。首先是提高源...原创 2021-01-11 18:55:52 · 1265 阅读 · 0 评论 -
MSER+NMS 文本检测(身份证+发票+火车票)
版权 此篇文章不细说MSER和NMS原理,以实战为主。 MSER是最大稳定极值区域:是对一幅灰度图像(灰度值为0~255)取阈值进行二值化处理,阈值从0到255依次递增。阈值的递增类似于分水岭算法中的水面的上升,随着水面的上升,有一些较矮的丘陵会被淹没,如果从天空往下看,则大地分为陆地和水域两个部分,这类似于二值图像。在得到的所有二值图像中,图像中的某些连通区域变化很小,甚至没有变化,则该区域就被称为最大稳定极值区域。具体算法的原理参考:Opencv2.4.9源码分析——MS...原创 2020-12-23 13:12:12 · 833 阅读 · 0 评论 -
opencv中的MSER的使用和NMS后图片文字区域
MSER(Maximally Stable Extrernal Regions)是区域检测中影响最大的算法1. 原理MSER基于分水岭的概念:对图像进行二值化,二值化阈值取[0, 255],这样二值化图像就经历一个从全黑到全白的过程(就像水位不断上升的俯瞰图)。在这个过程中,有些连通区域面积随阈值上升的变化很小,这种区域就叫MSER。,其中Qi表示第i个连通区域的面积,Δ表示微小的阈值变化(注水),当vi小于给定阈值时认为该区域为MSER。显然,这样检测得到的MSER内部灰度值是...原创 2020-12-21 22:57:23 · 1188 阅读 · 0 评论 -
震惊!AI居然轻松消除马赛克-文字增强,GitHub开源项目上线三天收获近7000星
还在用马赛克的方式隐藏密码?小心被「看穿」。像素化(又称马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息,比如:再比如:看图找马赛克!(找不到请看右侧原图)但是,在你想隐藏信息的同时,有一些技术却反其道而行之,试图将图片还原为原始状态。最近,一个名为 Depix 的 GitHub 项目爆火,上线三天 star 量已经高达 6.9k。项目作者 Sipke Mellema 是一名信息安全顾问。...转载 2020-12-11 12:28:24 · 2598 阅读 · 0 评论 -
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
本文代码、及测试图片在公众号 datadw 里 回复图片分类 即可获取。我们一般用深度学习做图片分类的入门教材都是MNIST或者CIFAR-10,因为数据都是别人准备好的,有的甚至是一个函数就把所有数据都load进来了,所以跑起来都很简单,但是跑完了,好像自己还没掌握图片分类的完整流程,因为他们没有经历数据处理的阶段,所以谈不上走过一遍深度学习的分类实现过程。今天我想给大家分享两个比较贴近实际的分类项目,从数据分析和处理说起,以Keras为工具,彻底掌握图像分类任务。这两个分类...原创 2020-12-06 23:35:04 · 839 阅读 · 1 评论 -
文字检测模型EAST应用详解二 pb的opencv加载
贴一下opencv加载pb的方法,跟加载其他模型没有区别。def main(argv=None): # import the necessary packages from imutils.object_detection import non_max_suppression import numpy as np import argparse import time import cv2 # construct the argument p...原创 2020-12-03 22:50:27 · 319 阅读 · 1 评论 -
文字检测模型EAST应用详解 ckpt pb的tf加载,opencv加载
参考链接:https://github.com/argman/EAST(项目来源) https://github.com/opencv/opencv/issues/12491 (遇到的问题) https://www.pyimagesearch.com/2018/08/20/opencv-text-detection-east-text-detector/ (opencv加载)文字检测有很多比较好的现成的模型比如yolov3,pesnet,pen...原创 2020-12-03 22:48:40 · 281 阅读 · 0 评论 -
深度学习表格检测-table-ocr
https://github.com/chineseocr/table-ocrtable-ocrStar:119table-ocr是一个运用unet实现对文档表格的自动检测,表格重建的OCR项目。OCR工具是目前比较受欢迎,且提高很多工作效率的一类工具。它背后到底是如何实现的?table-ocr这个项目可以帮你揭开它神秘的面纱。img另外,使用过OCR工具的同学应该都清楚,OCR在印刷体文字识别过程中效果越来越好,但是在表格方面一直捉襟见肘。table-ocr就针对表格检原创 2020-11-28 19:43:34 · 6071 阅读 · 2 评论 -
使用 OpenCV 对图像中的区域进行透视变换
使用 OpenCV 对图像中的区域进行透视变换赵剑行手可摘星辰6 人赞同了该文章原文链接:4 Point OpenCV getPerspective Transform Example - PyImageSearchwww.pyimagesearch.com本篇文章介绍使用OpenCV的cv2.getPerspectiveTransform函数实现四点透视变换。我上次写了这篇文章,Python and OpenCV Example: Warp Perspecti...原创 2020-11-22 18:25:27 · 2017 阅读 · 0 评论 -
AI × OCR:腾讯文档表格图像识别技术实践
本文主要介绍基于深度神经网络的表格图像识别解决方案。作者:腾讯QQ研发中心——CV应用研究组的yonke1.前言1.1背景大多数人日常办公处理的文件,无非就是表格和文档,其中表格的重要性毋庸置疑。在各行各业的桌面办公场景中,Excel和WPS是电子表格的事实标准。我们经常遇到这种需求:将一个表格图片的内容导入Excel。以前我们只能对着图片把内容一点点敲进excel,既低效又容易出错。近年来,在深度学习的加持下,OCR (Optical Character Recogniti...转载 2020-11-21 10:42:03 · 3611 阅读 · 4 评论 -
如何使用OpenCV+Python去除手机拍摄文本底色
起因最近经常被要求手机拍摄考试卷,但是拍摄完之后,跟实际的黑白考试卷有很大的色差,打印出来之后背景就变成了灰色,看着很不舒服。于是我想起了好久以前,我用过的一个软件叫全能扫描王,发现它里面是有去除这种文本底色的功能的,但是有时候也很坑!我就想手动写一个简单python程序来实现。最终我写出的程序测试效果如下:左侧是用手机拍摄的图像,右侧是用opencv-python处理之后的结果。思路分析首先看一下输入的原图,(小学生作业找不到了,让我给他打印是起因,他要手写,我说我来处理一...转载 2020-11-18 18:14:28 · 1657 阅读 · 1 评论 -
机器学习进阶-项目实战-信用卡数字识别
机器学习进阶-项目实战-信用卡数字识别 1.cv2.findContour(找出轮廓) 2.cv2.boudingRect(轮廓外接矩阵位置) 3.cv2.threshold(图片二值化操作) 4.cv2.MORPH_TOPHAT(礼帽运算突出线条) 5.cv2.MORPH_CLOSE(闭运算图片内部膨胀) 6. cv2.resize(改变图像大小) 7.cv2.putText(在图片上放上文本)cv2.putText(img, text, loc, text_font, font_scale, col转载 2020-11-15 19:21:56 · 399 阅读 · 1 评论 -
基于区域对比度增强的二值化算法
http://jeit.ie.ac.cn/fileDZYXXXB/journal/article/dzyxxxb/2017/1/PDF/160197.pdf转载 2020-10-19 18:14:48 · 304 阅读 · 0 评论 -
基于OpenCV的表格文本内容提取
小伙伴们可能会觉得从图像中提取文本是一件很麻烦的事情,尤其是需要提取大量文本时。PyTesseract是一种光学字符识别(OCR),该库提了供文本图像。PyTesseract确实有一定的效果,用PyTesseract来检测短文本时,结果相当不错。但是,当我们用它来检测表格中的文本时,算法执行失败。图1.直接使用PyTesseract检测表中的文本图1描绘了文本检测结果,绿色框包围了检测到的单词。可以看出算法对于大部分文本都无法检测,尤其是数字。而这些数字却是展示了每日COVID-19病...转载 2020-10-06 18:56:52 · 2106 阅读 · 0 评论 -
tesseract图片文字识别 - 滤波 降噪 灰度 二值化 去除文本边框 去除验证码干扰线--承兑汇票
import org.apache.xmlgraphics.image.codec.tiff.TIFFEncodeParam;import org.apache.xmlgraphics.image.codec.util.ImageEncoder;import javax.imageio.ImageIO;import java.awt.*;import java.awt.image.BufferedImage;import java.io.File;import java.io.FileOut.转载 2020-09-18 12:28:49 · 1342 阅读 · 0 评论 -
OpenCV自带dnn的Example研究(6)— text_detection
这个博客系列,简单来说,今天我们就是要研究https://docs.opencv.org/master/examples.html下的6个文件,看看在最新的OpenCV中,它们是如何发挥作用的。在配置使用的过程中,需要注意使用较高版本的VS避免编译器兼容问题;由于DNN程序的运行依赖于训练成功的模型,因此需要预先下载准备;此外如果出现各种报错,需要对症下药。此外,由于需要使用common.hpp文件,所以需要引入dnn目录到include中用到的数据集都放在:链接...转载 2020-09-13 15:23:51 · 756 阅读 · 0 评论 -
10分钟上手,OpenCV自然场景文本检测(Python代码+实现)
【新智元导读】众所周知,自然场景下的文本检测是极具挑战性的。本文便使用OpenCV和EAST文本检测器在自然场景下对文本进行了检测,包括图像中的文本检测,以及视频中的文本检测,并对其原理与实现过程做了详尽的描述。在本教程中,您将学习如何使用EAST文本检测器在自然场景下检测文本。本教程的主要目的是教读者利用OpenCV和EAST文本检测器来检测文本。运行环境:EAST文本检测器需要OpenCV3.4.2或更高版本,有需要的读者可以先安装OpenCV。主要内容:教...转载 2020-09-13 11:33:55 · 2436 阅读 · 0 评论 -
票据图片复杂表格框识别(票据单元格切割)
票据图片复杂表格框识别(票据单元格切割)做票据OCR文字提取的时候,由于票据版面不固定,文字印刷错位、粘连等,想要提取目标内容非常困难。如果首先能把票据的表格框形式识别出来,再切割出单元格,OCR再识别单元格里面的内容会容易很多。运用unet实现对文档表格的自动检测所有代码获取:本文相关代码项目获取方式:关注微信公众号 datayx 然后回复表格 即可获取。AI项目体验地址 https://loveai.tech获取项目代码后,安装步骤:1、下载、编译 ...转载 2020-09-06 22:06:52 · 517 阅读 · 0 评论 -
基于Opencv和Tesseract的行驶证识别系统设计
张伟超, 肖中俊, 严志国. 基于Opencv和Tesseract的行驶证识别系统设计[J]. 齐鲁工业大学学报, 2020, 34(1): 47-52. DOI:10.16442/j.cnki.qlgydxxb.2020.01.009ZHANG W C, XIAO Z J, YAN Z G. Design of Vehicle License Identification System Based on OpenCV and Tesseract[J]. Journal of Qilu Univer..转载 2020-09-04 12:39:12 · 1608 阅读 · 1 评论 -
OCR文档二值化算法8-25
本文主要是二值化算法在OCR中的应用调研总结。调研和实现了四种二值化算法,分别是大津全局二值化算法、动态二值化算法、循环背景差分二值化算法以及Sauvola′sSauvola′s局部二值化算法。 结果显示,在无光照影响的扫描图像中,大津全局二值化算法的结果文字连通性更好,背景更干净,速度更快;局部二值化能有效应对光照不均等情况,但二值化文字的边缘存在毛刺,背景有较多噪音,计算资源要求大于全局二值化;所有通用的基于统计信息的二值化对较大面积且深度较高的干扰点和干扰块都无能为力,需要在二值化算法中整合文...原创 2020-08-25 12:29:06 · 1147 阅读 · 0 评论 -
答题卡识别增强项目
代码地址:https://github.com/SimonLliu/SheetIdentification请觉得有帮助的同学给小星星一、项目背景1、项目来源一家在线教育公司的实际需求2、项目需求将一张答题纸(包括字和图像)的答题区域提取出来,效果增强(去除阴影)3、项目要求1) 四角定位、扭曲矫正用相应设备扫描的答题卡,由于拍摄角度的原因,可能出现页面扭曲的问题,需要程序识别、四角定位,还原为长方形(长宽比需与原纸张一致)。2) 效果增强需做...转载 2020-08-17 23:17:45 · 612 阅读 · 0 评论 -
(附完整python源码)基于tensorflow、opencv的入门案例_发票识别三:发票数据集制作和cnn网络训练
1 制作数据集合1.1 在word上输入一行数字,我用的是Calibri字体,已经比较接近发票数字了。网友们可以自行定义字体。1.2 读入图片为灰度图,threshold化;并将图片颜色反转:字体为白背景为黑;对图像进行各种类型的膨胀,多样化数据。 # encoding: utf-8 import cv2 import numpy as np import os img0 = cv2.imre...转载 2020-07-31 18:32:16 · 1036 阅读 · 0 评论 -
如何提高OCR准确度(Acc)
说到文字识别--OCR技术,当下已被人们广泛使用, 许多公司通过采用OCR技术,将现有的工作流程和业务流程进行了极大的改进。人们在开源对技术上,不断推陈出新,OCR识别技术准确率也不断提升,在生产力方面取得效果也越来越突出。虽然提高OCR准确度不是一夜之间可以做到的事情,但人们肯定会在适当的时候尝试这样做。那么如何来微调(finetune)他们的OCR模型呢?嗯,有不同的方法来实现这一目标。我们Infrrd请记住以下提示:准确度可以在字符(字)级别实现。 ->characte...原创 2020-07-31 18:23:59 · 4118 阅读 · 0 评论 -
Halcon OCR--字符识别(CNN卷积神经网络)
https://blog.csdn.net/IntegralforLove/article/details/83756956转载 2020-07-20 18:21:50 · 1965 阅读 · 0 评论 -
pycorrector 纠错工具安装
pycorrector中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。Demohttps://www.borntowin.cn/product/correctorQuestion中文文本纠错任务,常见错误类型包括:谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺...原创 2020-07-18 14:33:05 · 2371 阅读 · 3 评论 -
Soft-Masked BERT:文本纠错与BERT的最新结合
文本纠错,是自然语言处理领域检测一段文字是否存在错别字、以及将错别字纠正过来的技术,一般用于文本预处理阶段,同时能显著缓解智能客服等场景下语音识别(ASR)不准确的问题。本文将通过以下几个章节简要介绍文本纠错相关知识。1. 文本纠错示例与难点2. 文本纠错常用技术3. 如何将 BERT 应用于文本纠错4. 文本纠错最优模型:Soft-Masked BERT(2020-ACL)5. 立马上手的纠错工具推荐一.文本纠错示例与难点生活中常见的文本错误可以分为(1)字形相似引起的错误...转载 2020-07-18 11:26:19 · 1025 阅读 · 1 评论 -
场景文字检测模型PixelLink详解与使用
详解PixelLink模型与使用!觉得不错,请点【在看】支持!OpenVINO是英特尔推出基于CPU/GPU新一代视觉加速框架,可以对常见的各种检测模型与分割模型在CPU端侧实现10倍以上加速。其自带预训练模型库支持多种常见视觉感知与识别应用场景,可以快速搭建原型演示程序与极简应用。相关视频教程可以点击下面链接学习:首发 | OpenVINO开发配套视频教程发布了PixelLink模型详解OpenVINO支持的场景文字检测是基于PixelLink模型,该模型是浙大联合阿里提出,其核心.转载 2020-07-13 12:38:15 · 1357 阅读 · 0 评论 -
tesseract_OCR-优化技巧系列
一、基于tesseract_OCR+opencv实现图片中汉字辨识-汉字笔画优化https://blog.csdn.net/lipc_/article/details/80812258二、基于Tesseract实现图片文字识别-表格采用单元格识别https://www.cnblogs.com/yszd/p/12072145.html原创 2020-07-06 22:10:30 · 2220 阅读 · 0 评论 -
两款开源的中文OCR工具
1.cnocrcnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用。cnocr主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。cnocr目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用。cnocr是Python3下的中英文OCR包,通过pip命令安装后即可直接使用。pip install cnocr==1.1.0V1.1.0对代码做了很大改动,...转载 2020-07-04 16:38:50 · 7308 阅读 · 5 评论 -
CVPR 2020 论文大盘点-文本图像篇
本文盘点CVPR 2020 所有文本图像(text)相关论文,主要分为手写文本和场景文本两大方向,总计16篇,对文献进行了细致的分类,大部分论文是围绕识别问题的研究。方向包括:1)场景文本检测(Scene Text Detection),从街景等场景文本中检测文本的位置,2 篇文献均为不规则任意形状文本的检测;2)场景文本识别(Scene Text Recognition),对场景文本检测得到的结果进行识别,共 4 篇文章;3)手写文本识别(HandwrittenText Re...转载 2020-06-18 12:10:46 · 1967 阅读 · 0 评论 -
keras-ocr是CRAFT文本检测器和Keras CRNN识别模型的一个打包与灵活版本
详细内容问题7同类相比218keras-ocrThis is a slightly polished and packaged version of theKeras CRNN implementationand the publishedCRAFT text detection model. It provides a high level API for tr...转载 2020-04-09 08:31:01 · 1694 阅读 · 0 评论 -
RNN入门(三)利用LSTM生成旅游点评
介绍 前几天,某个公众号发文质疑马蜂窝网站,认为它搬运其它网站的旅游点评,对此,马蜂窝网站迅速地做出了回应。相信大多数关注时事的群众已经了解了整个事情的经过,在这里,我们且不论这件事的是是非非,也不关心它是否是通过爬虫等其他技术手段实现的。本文将会展示一种自动生成旅游点评的技术手段。我们用到的模型为LSTM模型。 LSTM模型是深度学习中一种重要的模型,全称为Long Short-...转载 2020-04-06 09:31:30 · 492 阅读 · 0 评论 -
如何识别图片中的表格数据(opencv 和pyteressact)
在很多时候,我们的数据来源形式是多种多样的,有时候数据(或表格)也会呈现在图片中。那么,我们如何来获取图片中的有用数据呢?当一张图片中含有表格数据的时候,我们可以用OpenCV识别表格中的直线,然后再用OCR技术识别其中的文字。 本文仅作为如何识别图片中的表格的一个例子,希望能给读者一些启示。笔者用到的工具如下:opencv pyteressact numpy我们用open...转载 2020-04-06 09:20:20 · 6908 阅读 · 2 评论 -
tensorflow LSTM+CTC实现端到端的不定长数字串识别
12017.08.22 12:01:17字数 1,677阅读 43,984上一篇文章tensorflow 实现端到端的OCR:二代身份证号识别实现了定长18位数字串的识别,并最终达到了98%的准确率。但是实际应用场景中,常常需要面对无法确定字串长度的情况,这时候除了需要对识别字符模型参数进行训练外,还需要对字符划分模型进行训练,本文实现了上文提到的方法2,使用LSTM+CTC识别不定长...转载 2020-04-04 09:12:57 · 647 阅读 · 1 评论 -
基于OPENCV和tesseract的中文扫描票据OCR识别。
https://github.com/JiangKui007/jx_ocr转载 2020-03-08 14:57:12 · 3714 阅读 · 0 评论 -
【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建。用深度学习做文字识别,用的网络当然是CNN,那具体使用哪个经典网络?VGG?RESNET?还是其他?我想了下,越深的网络训练得到的模型应该会更好,但是想到训练的难度以及以后线上部署时预测的速度,我觉得首先建立一个比较浅的网络(基于LeN...转载 2020-02-29 11:38:49 · 1335 阅读 · 1 评论 -
Opencv获取身份证号码区域
记得应该是16年的时候,从一个公开课看到了关于OCR方面的内容,里面讲到了通过OpenCV对身份证号码区域的剪裁以及使用Tess-Two进行文字识别,实现了对身份证号码的识别功能。断断续续看了点关于OpenCV的资料,感觉不是这个专业的真难看懂,各种公式各种名词。今天主要用于做个记录,那个一直碎碎念的东西终于完成了!原理我理解的原理(除去文字识别):对图片进行降噪以及二值化,凸...转载 2020-02-20 22:49:42 · 873 阅读 · 0 评论 -
openCV 透视化提取图像中的矩形区域及图像校正
改编自 https://segmentfault.com/a/1190000013925648 原文是c++版,我改成了python版,供大家参考学习。主要思想:边缘检测—》轮廓检测—》找出最大的面积的轮廓—》找出顶点—》投影变换import numpy as npimport cv2# 这个成功的扣下了ppt白板srcPic = cv2.imread('2345.jpg')len...转载 2020-02-16 20:11:15 · 2176 阅读 · 0 评论