OCR
shelleyHLX
这个作者很懒,什么都没留下…
展开
-
ICPR MTWI 2018挑战赛 网络图像的文本识别之数据预处理
该数据预处理工作主要是基于图片数据集&坐标文本信息数据集来对图片进行切割和文本信息的匹配。实现过程中参考的博客:opencv图片旋转矩形分割https://blog.csdn.net/u013948010/article/details/78605043基于anaconda的编辑器spyder,python3.6,图像处理的库使用了Opencv,由于anaconda自带有的集成环境以及Anaconda Navigator可以让总是被折磨于环境和库的配置的菜鸟得以苟活。综上所述...转载 2020-12-28 13:52:46 · 1492 阅读 · 0 评论 -
文本检测模型之CTPN
文本检测模型之CTPN思路将文本定位框拆分成一个个等宽(论文中为16)的小文本框,然后只需在y方向上做回归。这里仍然使用了rpn(可看faster rcnn),唯一不同的是这里得到的候选区域(region proposal )是一个等宽不等高的。这种小文本框也规避了网络感受野不足的问题。 使用了cnn+rnn的组合,这里加入rnn使得宽度方向上或者说水平方向上形成一种联系(长短时记忆),所以即使文字间距较大,也能将文本连起来。(对长文本尤其是字符间距过大的文本效果友好) 通过网络及一系列处理后得转载 2020-12-17 11:06:04 · 742 阅读 · 0 评论 -
基于pytorch的OCR识别库
基于pytorch的OCR识别库对一年来学习的算法做了一个整理,同时也方便使用(项目持续更新中)识别库的地址:github地址这里支持的算法包括:DBnet论文链接PSEnet论文链接PANnet论文链接SASTnet论文链接CRNN论文链接这里做了什么:对上面算法进行了实现和实验 提供各个算法的训练和测试接口 提供各个算法的预训练模型 支持pytorch转成onnx,及onnx调用接下来会做什么:提供onnx转tensorrt的python接口...转载 2020-12-17 10:57:44 · 1832 阅读 · 0 评论 -
lanms-pybind的笔记
文章目录makefile的python路径生成方法来自EAST的lanms的代码makefile的python路径CXXFLAGS = -I include -std=c++11 -O3 $(shell /home/hlx2/anapy35/bin/python3-config --cflags)LDFLAGS = $(shell /home/hlx2/anapy35/bin/python3-config --ldflags)DEPS = lanms.h $(shell find includ原创 2020-06-01 17:29:40 · 666 阅读 · 0 评论 -
EAST-总结与翻译: An Efficient and Accurate Scene Text Detector
文章目录1.笔记1.1.论文关键idea1.2.notes1.3.pipeline2.Abstract3.Introduction5.Methodology5.1.Pipeline5.2.Network Design5.3.Label Generation5.3.1.Score Map Generation for Quadrangle5.3.2.Geometry Map Generation5.4.Loss Functions5.4.1.Loss for Score Map5.4.2.Loss for G原创 2020-05-28 17:19:15 · 1297 阅读 · 0 评论 -
OCR-文本检测和文本识别的数据
文章目录1.文本识别数据集1.1.Synthetic Chinese String Dataset2.文本检测数据ICPR MWI 2018 挑战赛2.1.Pascal VOC20072.2.MSRA Text Detection 500 Database (MSRA-TD500)2.3.COCO-TEXT2.4.Google FSNS(谷歌街景文本数据集)2.5.Reading Chinese Text in the Wild(RCTW-17)2.6.Chinese Text in the Wild(CT原创 2020-05-20 15:38:48 · 6062 阅读 · 2 评论 -
opencv中的MSER的使用和NMS后的矩形框
MSER形象一点解释这个原理就是:MSER对一幅已经处理成灰度的图像做二值化处理,这个处理的阈值从0到255递增,这个阈值的递增类似于在一片土地上做水平面的上升,随着水平面上升,高高低低凹凸不平的土地区域就会不断被淹没,这就是分水岭算法,而这个高低不同,就是图像中灰度值的不同。而在一幅含有文字的图像上,有些区域(比如文字)由于颜色(灰度值)是一致的,因此在水平面(阈值)持续增长的一段时间内都不会被覆盖,直到阈值涨到文字本身的灰度值时才会被淹没,这些区域就叫做最大稳定极值区域。NMSNMS是经常伴随图像原创 2020-05-20 15:17:48 · 1115 阅读 · 0 评论 -
翻译和笔记--FOTS: Fast Oriented Text Spotting with a Unified Network
文章目录笔记1.FOTS: Fast Oriented Text Spotting with a Unified Network2.Abstract3.Introduction4.Related Work4.1.Text Detection4.2.Text Recognition4.3.Text Spotting5.Methodology5.1.Overall Architecture5.2.Te...原创 2020-05-06 15:46:54 · 1489 阅读 · 0 评论 -
自然场景文本检测识别技术综述
文章目录摘要应用概述模型基础基础网络FCN网络STN网络检测网络框架文本检测模型CTPN模型RRPN模型FTSN模型FTSN 模型DMPNet模型EAST模型SegLink模型PixelLink模型Textboxes/Textboxes++模型WordSup模型文本识别模型CRNN模型RARE模型端到端模型FOTS Rotation-Sensitive RegressionSTN-OCR模型训练数...转载 2019-12-24 11:35:55 · 614 阅读 · 0 评论 -
CTPN模型详解--Detecting Text in Natural Image with Connectionist Text Proposal Network
文章目录Abstract.1 Introduction1.1 Contributions2 Related Work3 Connectionist Text Proposal Network3.1 Detecting Text in Fine-scale ProposalsAbstract.We propose a novel Connectionist Text Proposal Netwo...原创 2019-11-25 21:46:59 · 1220 阅读 · 0 评论 -
使用Python基于VGG/CTPN/CRNN的自然场景文字方向检测/区域检测/不定长OCR识别
GitHub:https://github.com/pengcao/chinese_ocrhttps://github.com/xiaofengShi/CHINESE-OCR|-angle 基于VGG分类模型的文字方向检测预测|-bash 环境安装|----setup-python3.sh 安装python3环境|----setup-python3-cpu.sh 安装CPU环境...转载 2019-11-25 15:51:32 · 3288 阅读 · 0 评论 -
深入浅出了解OCR识别票据原理
光学字符识别技术(OCR)目前被广泛利用在手写识别、打印识别及文本图像识别等相关领域。小到文档识别、银行卡身份证识别,大到广告、海报。因为OCR技术的发明,极大简化了我们处理数据的方式。同时,机器学习(ML)和卷积神经网络(CNN)的快速发展也让文本识别出现了巨大的飞跃!我们在本文的研究中也将使用卷积神经网络CNN技术来识别零售店的纸质票据。为了方便演示,我们本次将仅采用俄语版的票据进行测试。...转载 2019-11-13 11:25:49 · 252 阅读 · 0 评论 -
如何精准实现OCR文字识别?
前言2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动,活动举办期间用户耐心听分享嘉宾的介绍,并提出了相关的问题,智能图像团队的科学家和工程师也耐心解答可用户的疑问。以下就是活动分享的全部内容。正文在日常生活工作中,我们难免会遇到一些问题,比如自己辛辛苦苦写完的资料,好不容易打印出来却发现源文件丢了。难的收集了一些名片,却...转载 2019-11-13 11:23:26 · 1571 阅读 · 0 评论