图像识别初识

1官方表达:

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。

2图像识别大致分为三个步骤:

1)提取特征

2)建索引build

3)查询。

3什么是模版?

模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板

4那么模版是怎么使用的呢?

这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。

5图像识别的几个阶段。

图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。

6图像识别的本质是什么?

图像识别问题的数学本质属于模式空间到类别空间的映射问题。

7图像识别的三种识别方法

统计模式识别、结构模式识别、模糊模式识别

8图像分割是图像识别当中重要的一个方法.

现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。

下面简单介绍这几种分割方法:

1)阈值与图像分割
阈值是在分割时作为区分物体与背景象素的门限,大于或等于阈值的象素属于物体,而其它属于背景。这种方法对于在物体与背景之间存在明显差别(对比)的景物分割十分有效。实际上,在任何实际应用的图像处理系统中,都要用到阈值化技术。为了有效地分割物体与背景,人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等等。
2)梯度与图像分割
当物体与背景有明显对比度时,物体的边界处于图像梯度最高的点上,通过跟踪图像中具有最高梯度的点的方式获得物体的边界,可以实现图像分割。这种方法容易受到噪声的影响而偏离物体边界,通常需要在跟踪前对梯度图像进行平滑等处理,再采用边界搜索跟踪算法来实现。
3)边界提取与轮廓跟踪
为了获得图像的边缘人们提出了多种边缘检测方法,如Sobel, Canny edge, LoG。在边缘图像的基础上,需要通过平滑、形态学等处理去除噪声点、毛刺、空洞等不需要的部分,再通过细化、边缘连接和跟踪等方法获得物体的轮廓边界。
4)Hough变换
对于图像中某些符合参数模型的主导特征,如直线、圆、椭圆等,可以通过对其参数进行聚类的方法,抽取相应的特征。
5)区域增长
区域增长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法,从初始区域(如小邻域或甚至于每个象素)开始,将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止。区域内象素的相似性度量可以包括平均灰度值、纹理、颜色等信息。
区域增长方法是一种比较普遍的方法,在没有先验知识可以利用时,可以取得最佳的性能,可以用来分割比较复杂的图像,如自然景物。但是,区域增长方法是一种迭代的方法,空间和时间开销都比较大。

9图像的分类主要有两种:

计算机图像分类方法,常见的有两种,即监督分类和非监督分类。监督分类,首先要从欲分类的图像区域中选定一些训练样区,在这样训练区中地物的类别是已知的,用它建立分类标准,然后计算机将按同样的标准对整个图像进行识别和分类。它是一种由已知样本,外推未知区域类别的方法;非监督分类是一种无先验(已知)类别标准的分类方法。对于待研究的对象和区域,没有已知类别或训练样本作标准,而是利用图像数据本身能在特征测量空间中聚集成群的特点,先形成各个数据集,然后再核对这些数据集所代表的物体类别。
与监督分类相比,非监督分类具有下列优点:不需要对被研究的地区有事先的了解,对分类的结果与精度要求相同的条件下,在时间和成本上较为节省,但实际上,非监督分类不如监督分类的精度高,所以监督分类使用的更为广泛。

个人总结:

监督分类:是有样本和模型及数据可以作为参考的一种分类方式

非监督分类:是通过时时录取数据,在录取数据的过程中来建立样本、模型、数据和规则的一种分类方式


10图像识别是如何对图像进行分析的?

看了很多资料,很多文字描述,但是这里我是简单做下概括,本人并不是此方面大神,所以略做介绍,仅供参考,图像识别用的是纹理分析,那么什么是纹理分析呢?

简单来说就是一个图像当中点、线疏密程度,曲线的平滑程度,如粗细度、平滑性、颗粒性、随机性、方向性、直线性、周期性、重复性等这些定性或定量的概念特征来表征。

11纹理简单分为两种:

因此可以认为纹理是由基元按某种确定性的规律或统计性的规律排列组成的,前者称为确定性纹理(如人工纹理),后者呈随机性纹理(或自然纹理)。



预处理:读取图片 第一步,缩小尺寸。 将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。 第二步,简化色彩。 将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。 第三步,计算平均值。 计算所有64个像素的灰度平均值。 第四步,比较像素的灰度。 将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。 第五步,计算哈希值。 将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。 得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。在理论上,这等同于计算"汉明距离"(Hammingdistance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。 你可以将几张图片放在一起,也计算出他们的汉明距离对比,就可以看看两张图片是否相似。 这种算法的优点是简单快速,不受图片大小缩放的影响,缺点是图片的内容不能变更。如果在图片上加几个文字,它就认不出来了。所以,它的最佳用途是根据缩略图,找出原图。 实际应用中,往往采用更强大的pHash算法和SIFT算法,它们能够识别图片的变形。只要变形程度不超过25%,它们就能匹配原图。这些算法虽然更复杂,但是原理与上面的简便算法是一样的,就是先将图片转化成Hash字符串,然后再进行比较。 以上内容大部分直接从阮一峰的网站上复制过来,想看原著的童鞋可以去在最上面的链接点击进去看。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值