图像处理
文章平均质量分 90
拾梦王仙岭
这个作者很懒,什么都没留下…
展开
-
OpenCV学习笔记大集锦
整理了我所了解的有关OpenCV的学习笔记、原理分析、使用例程等相关的博文。排序不分先后,随机整理的。如果有好的资源,也欢迎介绍和分享。1:OpenCV学习笔记作者:CSDN数量:55篇博文网址:http://blog.csdn.net/column/details/opencv-manual.html2:部分OpenCV的函数解读和原理解读作者:梦转载 2017-07-14 16:32:03 · 304 阅读 · 0 评论 -
LSTM简介
转载自:http://blog.csdn.net/peaceinmind/article/details/50848128导语LSTM[1]作为RNN的经典模型,已经应用在了很多领域,如语音识别[2],OCR[3,4,16],图像描述[5],手写字识别[6],翻译[7],自然语言处理等等。在线手写字识别[11]图像内容描述[5] 1为什转载 2017-07-14 16:29:58 · 2528 阅读 · 0 评论 -
过分割和beam search
转载自:http://blog.csdn.net/peaceinmind/article/details/51347679前面的章节已经介绍了提取文本行的方法。本文主要介绍传统的依赖over segmentation过分割,beam search和字符分类器的识别方法。主要参考文献[1]和opencv contribute中text module中的代码[5]。一般情况下我们会通过转载 2017-07-13 11:58:01 · 746 阅读 · 0 评论 -
Combined Character
转载自:http://blog.csdn.net/peaceinmind/article/details/503740891导语前两节我们分别解释了字符提取和字符过滤,在这过程中主要有=两个原因需要我们将单个字符组合成一个文字行或者段落之类(如图1)。一个重要的原因是出来不管是由于MSER的原因还是分类器的原因,有些真的字符并没有找出来,比如i和j上面的点等等,当然实际中情况要转载 2017-07-13 11:56:34 · 497 阅读 · 0 评论 -
Character Filter
转载自:http://blog.csdn.net/PeaceInMind/article/details/50003319导语在上一章节中我们介绍了怎么在一幅图片中提取潜在的字符(character proposals)。一般情况下基本上都会发生两种不想要的情况。第一种就是有些字符没提取出来,称之为false negative,这个可以通过多通道(如梯度幅值或者其他颜色通道)提取M转载 2017-07-13 11:52:32 · 415 阅读 · 0 评论 -
Character Detection and Recognition 1-MSER
转载自:http://blog.csdn.net/peaceinmind/article/details/49933055导语文字识别在现实场景中的用途非常广泛,现在已经有很多公司将这项技术用于实际中。比如车牌识别,图片转换成文档,拍照搜题,拍照翻译等。这让很多人有了错觉,感觉文字识别的技术已经炉火纯青,可以广泛应用。其实不然,车牌识别里面字体和字的类型比较单一,并且有一些矩形转载 2017-07-13 11:47:57 · 737 阅读 · 0 评论 -
Resource of Character Detection and Recognition
转载自:http://blog.csdn.net/peaceinmind/article/details/51387367综述[2015-PAMI-Overview]Text Detection and Recognition in Imagery: A Survey[paper] [2014-Front.Comput.Sci-Overv转载 2017-07-13 11:41:27 · 785 阅读 · 0 评论 -
VS2010下 使用HALCON12 的库
转载自:http://blog.csdn.net/u012374012/article/details/42552053HALCON 本质上讲 是一个函数库, 虽然也有HALCON10 11 12 之类的开发环境,但是这些东西顶到天上去 不过是给我们调试算子用的,他没有办法开发出一个好看使用的界面出来。 所以我们要使用其他开发环境,我选择了VS2010。 对于在如何在V转载 2017-07-17 21:37:07 · 2945 阅读 · 0 评论 -
Tesseract-OCR学习系列(一)简介
转载自:http://www.jianshu.com/p/0a3386227981Tesseract Introduction做了一段时间的OCR。在PC的Visual Studio上和在TI/ADI的DSP上都做过。一般都是看项目的具体情况,然后根据这具体情况,设计一套算法。设计好了之后,这套算法就只能应用在这个项目上了。如果再来一个新的项目,就又得从头写起。可是,不就是转载 2017-09-25 16:02:24 · 8461 阅读 · 0 评论 -
图像去雾之何凯明暗通道先验去雾算法原理及c++代码实现
转载自:http://blog.csdn.net/s12244315/article/details/50292049在图像去雾这个领域,几乎没有人不知道《Single Image Haze Removal Using Dark Channel Prior》这篇文章,该文是2009年CVPR最佳论文。作者何凯明博士,2007年清华大学毕业,2011年香港中文大学博士毕业,可谓是功力转载 2017-12-19 20:17:46 · 5130 阅读 · 1 评论 -
积分图像算法
转载自:https://www.cnblogs.com/Imageshop/p/6219990.html13行代码实现最快速最高效的积分图像算法。 研究图像到一定程度的人,应该都对积分图像有所了解,大家在百度或者google中都可以搜索到大量的相关博客,我这里不做多介绍。用积分图也确实能解决很多实际的问题,比如我博客中的基于局部均方差相关信息的图像去噪及其在实时磨皮美容算法中的应转载 2017-11-29 11:21:55 · 3272 阅读 · 0 评论 -
相机成像原理(四个坐标系转换)
转载自:http://blog.csdn.net/chentravelling/article/details/535580960.前言最近整理了“相机成像原理”和“视差与深度信息”相关的资料,然后做成了PPT,以备自己用,也提供给相关的图像、视觉方向的朋友参考。如有误,望海涵并指出。1.正文图像处理、立体视觉等等方向常常涉及到四个坐标系:世界坐标系、相机坐标系、图像坐标系转载 2017-11-03 11:24:26 · 13515 阅读 · 8 评论 -
Tesseract-OCR 字符识别---样本训练
转载自:http://blog.csdn.net/firehood_/article/details/8433077Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google维护,目前发布在转载 2017-09-21 11:12:23 · 328 阅读 · 0 评论 -
Halcon OCR 字符训练识别
转载自:http://blog.csdn.net/zhang2012liang/article/details/509931731 Halcon 例子 里面其实自带字符训练和识别2 Halcon OCR训练分SVM和MLP两种3 Halcon提供了一些识别模型,但是毕竟自己的项目跟他的不一样,所以需要自己训练自己的模型4 下面先以SVM训练和识别开始(创建训练文件,训练,转载 2017-09-26 16:36:13 · 2783 阅读 · 0 评论 -
Tesseract-OCR学习系列(四)API
转载自:http://www.jianshu.com/p/3df039e42986Other API Examples参考文档:https://github.com/tesseract-ocr/tesseract/wiki/APIExample在上一篇中, 我们学习了参考文档中的第一个示例。用CMake构建了工程,并且看了一下例子中调用到的API。在这一篇中,我们继续看一看其它转载 2017-09-25 16:06:40 · 4685 阅读 · 1 评论 -
Tesseract-OCR学习系列(三)简例
转载自:http://www.jianshu.com/p/a53c732d8da3Tesseract API Basic Example using CMake Configuration参考文档:https://github.com/tesseract-ocr/tesseract/wiki/APIExampleTesseract提供的API可以在baseapi.h转载 2017-09-25 16:05:26 · 2877 阅读 · 0 评论 -
Tesseract-OCR学习系列(二)构建
转载自:http://www.jianshu.com/p/5446776095b8Build project from Tesseract Source Code for Visual Studio 2012上一节讲到,如果直接编译libtesseract304工程,会有报错。说找不到某个头文件。看来,Tesseract还依赖于第三方的库。当然,这么没来由的瞎猜也不是个转载 2017-09-25 16:03:36 · 1272 阅读 · 0 评论 -
图像形状特征(八)--SC形状上下文
形状上下文特征是一种很流行的形状描述子,多用于形状匹配,目标识别,它采用一种基于形状轮廓的特征描述方法,其在对数极坐标系下利用直方图描述形状特征能够很好地反映轮廓上采样点的分布情况。形状上下文的基本原理如下:Step1:对于给定的一个形状,通过边缘检测算子(如:canny算子)获取轮廓边缘 ,对轮廓边缘采样得到一组离散的点集P={p1,p2,p3,..pn},如图1中的字母A。转载 2017-04-27 17:05:07 · 5562 阅读 · 1 评论 -
图像形状特征(七)--Zernike矩
原文:http://blog.csdn.NET/wrj19860202/article/details/6334275Zernike在1934年引入了一组定义在单位圆 上的复值函数集{ },{ }具有完备性和正交性,使得它可以表示定义在单位圆盘内的任何平方可积函数。其定义为: 表示原点到点 的矢量长度; 表示矢量 与 轴逆时针方向的夹角。 是实值径向多转载 2017-04-27 17:04:28 · 3583 阅读 · 1 评论 -
Matlab 形态学图像处理
本文转载自:http://www.cnblogs.com/tornadomeet/archive/2012/03/20/2408086.html本文的内容主要是形态学的一些基本概念和技术,这些构成了一组提取图像特征的有力工具,针对二值图像和灰度图像的腐蚀、膨胀和重构的基本操作可以组合使用,以执行非常宽泛的任务。其练习代码和结果如下: 1 %% 第9章 形态学处理 2转载 2017-04-11 15:22:57 · 796 阅读 · 0 评论 -
基于MATLAB的二值化图像常用的三种方法
图像分割是模式识别和计算机视觉中很重要的一个部分,基于阈值的图像分割具有简单、计算量小、效率高等特点,在实际图像处理中具有广泛的应用。经过国内外学者的广泛努力,已经提出了数以百计的阈值分割的算法,依据阈值分割算法本身所具有的准则或特性,可以分为迭代法、最大类间误差法(Otsu)、最大熵法等。本文主要介绍以上几种阈值分割方法。(一)迭代法 迭代法是一种比较简单的阈值分割方法,其思想:设置转载 2017-04-11 15:05:51 · 7322 阅读 · 1 评论 -
OpenCV实现基于傅里叶变换的旋转文本校正
代码 先给出代码,再详细解释一下过程:12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868转载 2017-03-24 17:11:54 · 966 阅读 · 0 评论 -
图像处理 C语言 文本图像的倾斜校正
程序功能是把一副倾斜的文字图像矫正过来 这个程序,我熬了一夜1、读取图像,创建结构元素for(i=0;i原图高度{for(j=0,n=0;n对24位图像二值化处理img.width原图宽度{//gray 根据原图rgb值计算灰度值存在gray中gray= ((float)(img.image[lineBytes*i+n+2])+(float)(*(img.image+l转载 2017-03-24 16:36:54 · 1567 阅读 · 0 评论 -
车牌定位--颜色分割
转载自:http://blog.csdn.net/liujia2100/article/details/30845493车牌定位是车牌识别中第一步,也是最重要的一步。由于中国车牌种类多样,颜色不一, 再加上车牌经常有污损,以及车牌周围干扰因素太多,都成为了车牌定位的难点。这里首先使用最简单算法来描述车牌定位,以及他的缺陷和改进。一、投影法1、车辆图像信息获取转载 2017-04-10 16:34:19 · 478 阅读 · 0 评论 -
OpenCV手写数字字符识别(基于k近邻算法)
摘要本程序主要参照论文,《基于OpenCV的脱机手写字符识别技术》实现了,对于手写阿拉伯数字的识别工作。识别工作分为三大步骤:预处理,特征提取,分类识别。预处理过程主要找到图像的ROI部分子图像并进行大小的归一化处理,特征提取将图像转化为特征向量,分类识别采用k-近邻分类方法进行分类处理,最后根据分类结果完成识别工作。程序采用Microsoft Visual Studio 2010转载 2017-03-23 13:34:43 · 594 阅读 · 0 评论 -
车牌识别及验证码识别的一般思路
本文源自我之前花了2天时间做的一个简单的车牌识别系统。那个项目,时间太紧,样本也有限,达不到对方要求的95%识别率(主要对于车牌来说,D,0,O,I,1等等太相似了。然后,汉字的识别难度也不小),因此未被对方接受。在此放出,同时描述一下思路及算法。全文分两部分,第一部分讲车牌识别及普通验证码这一类识别的普通方法,第二部分讲对类似QQ验证码,Gmail验证码这一类变态验证码的识别方法和思路。转载 2017-03-23 11:20:42 · 253 阅读 · 0 评论 -
《Mastering Opencv ...读书笔记系列》车牌识别(II)
继上一篇文章后,现在要做的就是从车牌图像上使用optical character recognition算法将字符提取出来。对于每一块被检测的车牌,使用带监督的神经网络机器学习算法来识别字符。本文内容:1.字符分割 2.神经网络训练方法3.使用神经网络预测字符一、字符分割【OCR Segment】在使用神经网络对每个字符进行预测之前,我们必须从车牌图像中扣取改字转载 2017-03-27 15:12:16 · 600 阅读 · 0 评论 -
OpenCV下车牌定位算法实现代码(一)
车牌定位算法在车牌识别技术中占有很重要地位,一个车牌识别系统的识别率往往取决于车牌定位的成功率及准确度。 车牌定位有很多种算法,从最简单的来,车牌在图像中一般被认为是长方形,由于图像摄取角度不同也可能是四边形。我们可以使用OpenCV中的实例: C:/Program Files/OpenCV/samples/c.squares.c 这是一个搜索图片中矩形的一个算法。我们只要稍转载 2017-03-27 14:29:43 · 635 阅读 · 0 评论 -
OpenCV下车牌定位算法实现代码 (二)
前面介绍了用OpenCV的squares实例定位车牌的算法,效果不是很理想。车牌定位的方法有很多种,这里我们从汽车图像的纹理特征入手,找出车牌不同于背景的特征是车牌定位的关键。观察多幅汽车图片我们会发现车身和背景的纹理多为横向纹理,而车牌字符则为竖向纹理,基于这个纹理特征我们可以区别处车牌位置。车牌的定位我们可以分为如下几个步骤:1预处理 图像的预处理主要是为了后续处理的需要进转载 2017-03-27 14:36:33 · 823 阅读 · 0 评论 -
学习OpenCV——车牌检测(定位)
这两天在做关于车牌识别的实验,用了几种方式:1.车牌颜色分布(HSV空间,YCrCb空间的没有颜色分布图谱,无法实验);利用HSV的H通道,效果一般,受环境影响大。[cpp] view plain copy print?#include "highgui.h" #include "cv.h" #include #转载 2017-03-27 14:45:31 · 801 阅读 · 0 评论 -
图像形状特征(五)--自由式变形模板
变形模板分自由式和参数式,这里先说自由式,典型的自由式变形模板,就是本文的snake模型。原文转自:http://blog.csdn.NET/zouxy09/article/details/8712287 基于能量泛函的分割方法: 该类方法主要指的是活动轮廓模型(active contour model)以及在其基础上发展出来的算法,其基本思想是使用连续曲线来表达目转载 2017-04-27 17:03:25 · 1497 阅读 · 0 评论 -
二维物体形状识别方法(一)
原文:http://blog.csdn.NET/liuqz2009/article/details/47624145物体识别是计算机视觉应用的一项基本任务。识别通常基于目标物体的灰度信息、颜色信息或形状信息。物体识别的目的就是要找到一个包含可以区分不同目标物体的有效信息的描述。由于要识别的物体是事先知道的,所以目标物体的几何特征可以被直接应用到识别任务中。 不规则物体的形状匹转载 2017-04-27 16:55:35 · 1163 阅读 · 0 评论 -
二维物体形状识别方法(二)
这个论文不知道作者转自哪里,暂时就写博客作者地址吧:http://blog.chinaunix.NET/uid-24517893-id-3140811.html摘 要 针对模式识别中二维物体的形状识别问题,以二值图像中的物体形状为主要研究对象,依次从特征提取、分类器设计两个主要层面对形状识别方法进行了全面综述,并分析了国内外研究现状,特别是近年来所取得的最新研究成果。最后,指出了目转载 2017-04-27 16:53:12 · 1812 阅读 · 0 评论 -
图像形状特征(四)--轮廓树及PGH
轮廓树 轮廓树用来描述某个特定轮廓的内部特征。注意:轮廓树跟轮廓是一一对应的关系;轮廓树不用于描述多个轮廓之间的层次关系。 轮廓树的创建过程: 从一个轮廓创建一个轮廓树是从底端(叶子节点)到顶端(根节点)的。首先搜索三角形突出或者凹陷的形状的周边(轮廓上的每一个点都不是完全和它的相邻点共线的)每个这样的三角形被一条线段代替,这条线段通过连接非相邻点的两点得到;因转载 2017-04-27 16:51:36 · 1686 阅读 · 0 评论 -
图像形状特征(三)--链码及形状数
转自:http://blog.csdn.NET/yang6464158/article/details/39801381Freeman链码(弗雷曼链码)是指用曲线起始点的坐标和边界点方向代码来描述曲线或边界的方法,常被用来在图像处理、计算机图形学、模式识别等领域中表示曲线和区域边界。它是一种边界的编码表示法,用边界方向作为编码依据,为简化边界的描述,一般描述的是边界点集。常用的链码转载 2017-04-27 16:50:50 · 12170 阅读 · 3 评论 -
图像形状特征(二)--Hu距
原文转自:http://blog.csdn.NET/wrj19860202/article/details/63270941. 矩的概念图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。矩是概率转载 2017-04-27 16:49:50 · 714 阅读 · 0 评论 -
图像的矩特征
1. 矩的概念图像识别的一个核心问题是图像的特征提取,简单描述即为用一组简单的数据(图像描述量)来描述整个图像,这组数据越简单越有代表性越好。良好的特征不受光线、噪点、几何形变的干扰。图像识别发展几十年,不断有新的特征提出,而图像不变矩就是其中一个。矩是概率与统计中的一个概念,是随机变量的一种数字特征。设XX为随机变量,cc为常数,kk为正整数。则量E[(x−c)k]E[(x−c)转载 2017-05-02 15:04:07 · 3486 阅读 · 0 评论 -
车牌识别--倾斜矫正
转载自:http://blog.csdn.net/liujia2100/article/details/26989939在车牌识别系统中, 车牌字符能够正确分割的前提是车牌图像能够水平,以至于水平投影和垂直投影能够正常进行。如果车牌倾斜没有矫正,那么水平投影和垂直投影,甚至铆钉都无法正常处理。所以,当车辆信息中获取车牌的第一步,应该是检查倾斜角度,做倾斜矫正。倾斜矫正,这里使用转载 2017-04-13 15:21:19 · 1474 阅读 · 1 评论 -
《Mastering Opencv ...读书笔记系列》车牌识别(I)
一、ANPR简介: Automatic Number Plate Recognition (ANPR),,是一种使用Optical Character Recognition (OCR)和其他分割、检测方法来读取汽车注册牌照的算法。最好的ANPR算法结果是由红外线照相机拍摄图片得到的。因为车牌的特殊材质,夜间会有逆反射效果,看不清车牌。但是现在我们不使用IR图片,我们使用常规图片,这样就转载 2017-03-27 15:08:14 · 405 阅读 · 0 评论