人脑是怎样认知图像的?——特征分析模式(传统模式识别之三)

前面已经说过,模式是由若干元素或成分按一定关系构成的。这些元素或成分可称为特征,而其关系有时也称为特征。特征说认为,模式可分解为诸特征。

例如,一个大写的英文字母A可以分解为下列特征(见下图):两条斜线、一条水平线和3个锐角。这3个锐角实际上表明这些线段的关系,即两条斜线相交和水平线与两条斜线相接。

LindsayNorman1977)指出,构成所有26个英文字母的特征共有7种,即垂直线、水平线、斜线、直角、锐角、连续曲线和不连续曲线,如F有一条垂直线、两条水平线和3个直角;P有与F一样的特征,外加一条不连续曲线;R有与P一样的特征,另有一条斜线,等等。

Gibson1969)也曾就英文字母的特征提出过类似的看法,但区分出12种特征。

照特征说看来,特征和特征分析在模式识别中起着关键的作用。其认为外部刺激在人的长时记忆中,是以其各种特征来表征的,在模式识别过程中,首先要对刺激的特征进行分析,也即抽取刺激的有关特征,然后将这些抽取的特征加以合并,再与长时记忆中的各种刺激的特征进行比较,一旦获得最佳的匹配,外部刺激就被识别了。这就是一般的特征分析模型。  

 

 

  

特征说所强调的特征,不管它在长时记忆中的编码形式是怎样的,其地位和作用看起来类似模板说中的模板。

Anderson1980)指出,这种特征似可看作微型模板。这个看法是有一定道理的。也许可以说,特征是一种局部的部件模板。但是特征说毕竟不同于模板说,并且具有一定的优点。

 

首先,依据刺激的特征和关系进行识别,就可以不管刺激的大小、方位等其他细节,避开预加工的困难和负担,使识别有更强的适应性。

其次,同样的特征可以出现在许多不同的模式中,必然要极大地减轻记忆的负担。

第三,由于需要获得刺激的组成成分信息,即抽取必要的特征和关系,再加以综合,才能进行识别,这使模式识别过程可带有更多的学习色彩。这一点看来是极重要的。应当说,特征分析模型是含有较多的学习可能性的。

还可以预料,当不同的模式具有一些共同的特征时,就会使识别发生困难,甚至出现错误,将这些模式混淆起来。在人的实际知觉中,确实常常出现这些情况。这方面的事实也是支持特征说的有力的证据。对此曾进行过有关的实验研究。

特征分析模式是根据图像特征实现视觉再现。该模式首先是从图像中提取特征,而特征是依各种图像而千差万别的。因此特征的提取涉及面很广,与识别对象的各种物理、形态的性能都有关系。垂直线、水平线、曲线、角、交点、孔等都可以作为特征,因此产生了各种各样的特殊方法来抽取特征。均值、方差、信息量、相关系数、绝对值等也可以作为特征,这样就涉及到大量的特征计算。

特征分析模式还有两个难以克服的困难问题:一个是如何选取合理的特征去表示自然界的图像;另一个是如何确定所选特征之间的相互关系。

设想识别一只鸟,这时可以定义鸟的特征是:羽毛、翅膀、尾巴、鸟头和鸟脚。问题是识别羽毛、翅膀、尾巴、鸟头和鸟脚之类并不比识别一只完整的鸟容易。当然也可以将垂直线、水平线、曲线、角和圆作为鸟的特征。问题是这时要选取许许多多这类特征,而这类特征也可以用来描述小狗小猫,更何况至今无人用这类特征去描述自然界的复杂景物。

事实上所选取特征之间的相互关系也是个非常复杂的问题.特征所处的位置,特征之间相互形成的走向,特征与特征的相互干扰等等,以及阴影、叠合、掩盖等,都会影响视觉识别的最后结果。

特征分析模式在识别字符和简单几何图形中精度高。尤其是识别人脸;生物学的实验说明,人的头脑中存在选择物体的某些特性的专门机构。

 

 

                                                                       (作者:刘建忠    http://hi.baidu.com/liujianz

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明
### 回答1: 模式识别是计算机科学中的重要领域,用于识别数据、文字、图像、语音等各种模式。在手写数字识别中,模式识别被广泛应用。在本文中,我将讨论三种方法进行手写数字识别程序包。 首先,人工神经网络:这种方法模仿人脑的神经元,将输入数据进行处理,并输出预测结果。使用神经网络需要训练数据集,包含正确的输入和输出相关性,来调节网络中的权重和偏置。如果训练有效,神经网络可以在未见过的数据上得到很好的结果。手写数字识别任务通常使用基于多层感知器(MLP)的神经网络。 其次,支持向量机(SVM):这种方法通过寻找数据的高维决策边界,分割输入数据。SVM需要输入数据用于建立模型,这个模型可以用来对新数据进行预测。在手写数字识别中,SVM被广泛应用,并擅长在高维空间中处理数据。 最后,卷积神经网络(CNN):这种方法是一种专门用于图像识别的神经网络,可以学习到图像特征。CNN通常由卷积、池化和全连接等层次组成,可以自动找到图像中的特征并进行分类。在手写数字识别中,CNN的性能已经具有统计学上显著的性能优势。 以上三种方法可以分别或结合使用进行手写数字识别,而MINIST数据集则是一个十分适用的训练和测试数据集,其中包含了60,000张训练图像和10,000 张测试图像,是科研人员和学生进行手写数据识别算法研究和开发的重要基础数据集。 ### 回答2: 在模式识别中,手写数字识别程序是一项经典的任务,它是通过从手写数字图像中提取特征来自动识别数字。在这个任务中,我们使用了三种常用的方法来编写一个手写数字识别程序包,并对其进行比较和评估。 第一种方法是基于传统机器学习的方法。我们使用了scikit-learn库来实现一个支持向量机分类器,并使用minist数据集来训练和测试该分类器。我们使用了 HOG 特征来提取每个数字的形状属性,通过将这些特征传递给分类器,最终实现手写数字的自动识别。该方法的优点是速度较快,但是准确率较低。 第二种方法是基于深度学习的方法。我们使用 TensorFlow框架来实现了一个具有多层全连接神经网络的深度学习模型。我们对minist数据集进行了预处理,并通过一系列反向传播和训练来尝试优化该模型。这种方法准确率比传统机器学习方法更高,但是训练时间较长。 第三种方法是基于深度卷积神经网络的方法。我们使用了keras框架来实现了一个经典的卷积神经网络模型。我们对训练数据进行了图像增强处理,并构建了一个包含多个卷积层和池化层的神经网络模型。该模型具有非常高的准确率,但是相应的训练和测试时间也更长。 总体来说,我们比较了三种不同方法的优缺点,并对其进行了评估。虽然深度学习模型具有最高的准确率,但是传统机器学习方法更适合于速度要求较高的场景。同时,不同的方法可以根据实际场景需求来选择合适的手写数字识别模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值