许多根据数据开发模型的方法都是从生物系统的学习能力,特别是从人的学习能力中得到的:是以数据驱动的方式来处理环境未知的统计属性,人并不具有天生的学习能力,而是通过与环境之间的数据驱动相互作用学到的。
从数据样本中学习的问题可以描述为古典哲学的普通推理概念,每个预测学习过程都包括两个主要阶段:
1、 从已知样本集中学习或估计系统中的未知的相关性(归纳)
2、 用估计出的相关性来预测系统对于将来的输入值的新的输出(演绎)
归纳学习和模型估计的过程可用不同的学习方法来描述,学习方法是一种估计系统在可用数据集中的输入和输出之间的未知映射的算法,即从已知样本中进行估计,一旦精确地估计出它们的相关性,就可以用于预测已知输入值的情况下系统将做的输出。
一、机器学习
机器学习作为人工智能和统计学的结合物,已被证明是一个富有成效的研究领域,产生了许多不同问题和这些问题解决方案的算法,所有算法都是搜索n维空间数据集,以找出一个合适的概括结果。机器学习的一个基本任务是归纳机器学习,它从样本集中获得概括结果,用不同的技术和模型来定型。
普通学习方案组成部分: