
文字识别
p312011150
这个作者很懒,什么都没留下…
展开
-
seglink 环境配置
代码地址:https://github.com/dengdan/seglink 1、安装opencv3.1.0 参考http://blog.csdn.net/u011440558/article/details/783584472、创建虚拟环境seg-env,安装tensorflowsudo apt-get install python-pip python-dev python-vi...转载 2018-09-13 17:50:28 · 805 阅读 · 1 评论 -
OCR文字识别用的是什么算法
General OCR一般包含两步:1. detection-->找到包含文字的区域(proposal);2. classification-->识别区域中的文字。 先说detection models.近两年比较热门的object detection model有 faster-rcnn 和 Yolo, 两个模型都是基于CNN给出proposed regions ...转载 2018-09-13 10:07:15 · 9034 阅读 · 0 评论 -
实践的意义——写给图像处理算法爱好者的建议
陆放翁诗云:“纸上得来终觉浅,绝知此事要躬行”,此乃亘古不变之真理也。 图像处理研究的一个很大特点就在于,它是一种和实际应用紧密联系的实用型学科。所有的算法都是针对实际中遇到的问题而存在的。无论是我们新提出了一个算法,还是我们新学习了一个算法,都可以直接写一个程序来检验它的处理效果。而且这种“效果”往往还是一目了然的。因为图像处理的输入和输出都是图像,图像就是用来给人看的。这种直观性是其它...转载 2018-09-12 15:24:30 · 1500 阅读 · 0 评论 -
运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别
运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别最近在学习计算机视觉相关的内容,在github上发现了非常好的项目chinese-ocr 该项目主要实现以下三个功能: 1. 文字方向检测 0、90、180、270度检测(这个功能不太实用,现实中角度不太会这么巧合) 2. 文字检测 后期将切换到keras版本文本检测 实现k...转载 2018-09-12 13:25:46 · 3076 阅读 · 4 评论 -
OCR识别的开源分析
OCR识别的开源分析OCR软件主要是由下面几个部分组成。 1. 图像输入、预处理: 2. 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等 3. 二值化: 对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先...转载 2018-09-12 13:21:58 · 1002 阅读 · 0 评论 -
将jTessBoxEditor训练的字库合并
集成环境:win10,jTessBoxEditor-1.7.31.需要生成字符集的.tif和.box这俩个文件。假设:需要合并三个字典liu.宋体.exp0,liu1.微软雅黑light.exp0,micrsoft.microsoftyaheiuilight.exp0(注:个人生成的字典有个人的名字,建议用自己的名字)(1)将这三个字典的.tif和.box文件拷贝到一个文件夹下;2...转载 2018-09-11 17:39:06 · 1399 阅读 · 0 评论 -
tesseract-ocr使用以及训练方法
本人最近在做字符识别,所以自行在网上寻找方法,接触到tesseract,自己按照网上方法做的时候,也遇到一些问题,解决了一些。所以我决定写下我第一个博客,一是方便自己以后查看,更新学习。二是方便和网友交流学习。Tesseract介绍 Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文...转载 2018-09-11 17:16:34 · 1359 阅读 · 2 评论 -
Tesseract-OCR识别中文与训练字库实例
关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR了,所以自己亲身试用一下,分享到博客让有同样兴趣的人少走弯路。文中所用到的身份证图片资源是百度找的,如有侵权可联系我删除。 一、准备工作1、下载Tesseract-OCR引擎,注意要3.0以上才支持中文哦,按照提示安装就行。2、下载chi_sim.traindata字库。要有这个才能识别中文。下好后,放到Te...转载 2018-09-11 15:23:30 · 368 阅读 · 0 评论 -
Tesseract-OCR的使用记录
Posted on 2017-10-19 18:57 丛影HHZ 阅读(689) 评论(0) 编辑 收藏参考:http://www.cnblogs.com/cnlian/p/5765871.htmlhttp://www.cnblogs.com/wzben/p/5930538.html 1、下载 Tesseract-OCR 及对应版本的 chi_sim.traindata 字库。...转载 2018-09-11 14:24:16 · 899 阅读 · 0 评论 -
如何使用tesseract-ocr4.0识别图片文字
首先下载tesseract-ocr安装包,附链接:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe下载完成后记住安装位置,后面要配置环境变量。简要描述配置环境变量,与Java配置环境变量类似,复制安装路径C:Program Files(x86)Tesseract-OCR 把这个路径添加到...转载 2018-09-11 13:46:36 · 1786 阅读 · 0 评论