概念
统计学习是关于计算机基于数据构建概论统计模型并运用模型对数据进行预测和分析的一门学科,也称为统计机器学习。
统计学习的只要特点:1、统计学习一计算机及网络为平台,是建立在计算机和网络上的;2、统计学习以数据为研究对象,是数据驱动的学科;3、统计学习的目的是对数据进行预测与分析;4、统计学习以方法为中心,统计学习方法构建模型并应有模型进行预测与分析;5、统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并在发展中逐步形成独自的理论体系与方法论。
统计学习研究的对象是数据。统计学习关于数据的基本驾驶室同类数据具有一定的统计规律,这是统计学习的前提。
统计学习总的目标就是考虑学习什么样的模型和如何学习模型,以使模型能对数据进行准确的预测和分析,同时也要考虑尽可能地提高学习效率。
统计学习的方法是基于数据构建概率统计模型从而对数据进行预测与分析。
统计学习方法的三要素:模型、策略、算法。
实现统计学习方法的步骤
- 1、得到一个有限的训练数据集合;
- 2、确定包含所有可能的模型的假设空间,即学习模型的集合;
- 3、确定模型选择的准则,即学习的策略;
- 4、实现求解最有模型的算法,即学习的算法;
- 5、通过学习方法选择最有模型;
- 6、理由学习的最优模型对新数据进行预测或分析。
注
x = ( x ( 1 ) , x ( 2 ) , ⋅ ⋅ ⋅ ⋅ , x ( i ) , ⋅ ⋅ ⋅ , x ( n ) ) T \Bigg (x^{(1)},x^{(2)},····,x^{(i)},···,x^{(n)}\Bigg )^\mathrm{T} (x(1),x(2),⋅⋅⋅⋅,x(i),⋅⋅⋅,x(n))T
- x ( i ) x^{(i)} x(i)表示x的第i个特征
- x ( i ) x^{(i)} x(i)与 x i x_{i} xi是不同的,通常 x i x_{i} xi表示多个输入变量的第i个变量,即 x i x_{i} xi= ( x i ( 1 ) , x i ( 2 ) , ⋅ ⋅ ⋅ ⋅ , x i ( i ) , ⋅ ⋅ ⋅ , x i ( n ) ) T \Bigg (x_{i}^{(1)},x_{i}^{(2)},····,x_{i}^{(i)},···,x_{i}^{(n)}\Bigg )^\mathrm{T} (xi(1),xi(2),⋅⋅⋅⋅,xi(i),⋅⋅⋅,xi(n))T