引言
前文介绍了通过插值来估计未知数据的方法。
蒙特遇见卡罗:数据分析中的插值与拟合(1) —— 插值zhuanlan.zhihu.com拟合的方法应用非常广泛,数据处理、参数估计和统计学习等;可以说只要有数据处理的地方,就会用到拟合;当前非常热门的大数据、机器学习和人工智能本质上就是在寻找拟合函数。
拟合的课题太大,本文只简单介绍其基本思想,并探讨应用最广泛的基于最小二乘的线性回归,以后文章会有一系列相关的专题开展讨论。
什么是拟合
通过插值方法可以在一定程度上完成预测等任务,但是该方法本身是存在缺陷的。
现实中的数据实际上是包含误差的,并且当数据量非常大时,插值的结果通常意义不大;此外,对于一些无法用显示函数表达,特别是“结构化”程度较低的数据,插值是无能为力的。考虑对其做一些调整,我们放弃估计函数必须通过已知数据的要求,允许存在一定的误差,同时目标是整体最优。与插值类似ÿ