统计学习理论简介

    统计学习理论是一种研究训练样本有限情况下的机器学习规律的学科。它可以看作是基于数据的机器学习问题的一个特例,即有限样本情况下的特例。统计学习理论从一些观测(训练)样本出发,从而试图得到一些目前不能通过原理进行分析得到的规律,并利用这些规律来分析客观对象,从而可以利用规律来对未来的数据进行较为准确的预测。例如,对全国未来几年人口数量进行预测,就需要先采集到过去几年甚至几十年的人口数据,并对其变化规律做出统计学方面的分析和归纳,从而得到一个总体的预测模型,这样就可以对未来几年的人口总体走势作一个大概的估计和预测。显然,这里采集到的过去人口的数据越准确,年份越长,分析归纳得到的统计规律就越准确,对未来人口预测就越接近真实水平。另外,如果只采集到了过去几年的人口数据,那么,这样得到的统计模型无论如何也是不够完美的。所以,不难发现,统计学习理论主要是研究以下三个问题:

① 学习的统计性能:通过有限样本能否学习得到其中的一些规律?

② 学习算法的收敛性:学习过程是否收敛?收敛的速度如何?

③ 学习过程的复杂性:学习器的复杂性、样本的复杂性、计算的复杂性如何?

     如今,统计学习理论在模式分类、回归分析、概率密度估计方面发挥着越来越重要的作用。

     统计模式识别问题可以看做基于机器学习的一个特例。而基于机器学习的方法是现代智能技术中十分重要的一个方面,主要研究如何从一些样本出发得出目前不能通过原理分析得到的规律,利用这些规律去分析客观对象,对未来数据或无法观测的数据进行预测。统计学中关于估计的一致性、无偏性和估计方差的界等,以及分类错误率等渐近性特征是实际应用中往往无法得不到满足,而这种问题在高维空间时尤其如此。这实际上是包含模式识别和神经网络等在内的现有的机器学习理论和方法中的一个根本问题。Viadimir N.Vapnik等人在20世纪60年代就开始研究有限样本情况下的机器学习问题,但由于当时这些研究尚不十分完善,在解决模式识别问题中往往区域保守,且数学上比较艰难,而直到90年代以前并没有提出能够将其理论付诸实现的较好方法。加之当时正处在其它学习方法飞速发展的时期,因此这些研究一直没有得到充分的重视。直到90年代中,有限样本情况下的机器学习理论研究研究逐渐成熟起来,形成了一个较完善的理论体系---统计学习理论。而同时,神经网络等较新兴的机器学习方法的研究则遇到了一些重要的困难,比如如何确定网络结构的问题、过学习与欠学习的难题、局部极小点的问题等。在这种情况下,试图从更本质上研究机器学习问题的统计学习理论逐步得到重视。

    1992-1995年,在统计学习理论的基础上发展出了一种新的模式识别方法----支持向量机(Support Vector Machine, SVM),在解决小样本问题,非线性及高维模式识别问题中表现出了许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。虽然统计学习理论和支持向量机方法尚有很多问题需要进一步研究,但很多学者认为,它们正在成为模式识别和神经网络研究之后机器学习领域新的研究热点,并将推动机器学习理论和技术的重大发展。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
全书,搞了很久才搞到。。。想传数字图像处理全书的,可惜我没有权限。要的朋友可以联系我 正如前面已经提到的那样,本书重点讨论统计模式识别方法中的特征提取和分类决策。 从教学角度出发,首先研究各种分类器的设计方法是qJ取的,在这个基础上就更容易理解特 征提取和选择的重要性。对于一个实际的模式识别系统,当然只有在特征确定以后,才能对 分类器的参数进行计算。实际工作中,这两者常常是互相交又进行的,对不同的方案要进行 反复比较,特别是设计过程还可能影响到对训练集的重新编辑。本书的前几章着重讨论监 督学习,即已知训练集样本所属类别的条件下分类器的设计方法。然后讨论特征提取和选择 的准则和算法。在这之后,讨论在不利用或没有样本所属类别信息的情况下的分类方法,即 非监督模式识别方法。根据有关模式识别理论和技术的发展、我们在讨论了统计模式识别的 经典内容之后,分别在第ll章中介绍“人工押经网络”,在第12章中介绍“模糊模式识别方 法”及第13章中介绍“统计学习理论和支持向量机”。最后在第14章巾简要介绍“模式U1别 在语音信号数字处理中的应用举例”、第15章中介绍“印刷体汉字识别小的特征提取”。希望 通过这些实例使读者对一些模式识别方法在一维信导和二维因像识别中的应用钉一个更直 观的认识;同时也可了解到利用信号处理和图像处理技术获取模式识别的特征的一些常用 方法。当然,由于篇幅和本书的目的所限,对这些例子的介绍只能是较简单的,仪供读者参 考,在学习模式识别课程时可以不讲、感兴趣者可以课后阅读。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值