在研究两个变量之间的关系时,可以用回归分析的方法进行分析。当确定了描述两个变量之间的回归模型后,就可以使用最小二乘法估计模型中的参数,进而建立经验方程.
简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小.
在我们研究两个变量(x, y)之间的相互关系时,通常可以得到一系列成对的数据(x1,y1、x2,y2... xm ,ym);将这些数据描绘在x-y直角座标系中(如图1),若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。
Y计= a0 + a1 X(式1-1)
其中:a0、a1 是任意实数
为建立这直线方程就要确定a0和a1,应用《最小二乘法原理》,将实测值Yi与利用(式1-1)计算值(Y计=a0+a1X)的离差(Yi-Y计)的平方和`〔∑(Yi - Y计)2〕最小为“优化判据”。
令: φ =∑(Yi - Y计)2 (式1-2)
把(式1-1)代入(式1-2)中得:
φ = ∑(Yi - a0 - a1 Xi)2 (式1-3)
当∑(Yi-Y计)平方最小时,可用函数 φ对a0、a1求偏导数,令这两个偏导数等于零。
(式1-4)
(式1-5)
亦即:m a0 + (∑X i ) a 1 = ∑Yi ( 式 1-6)
(∑Xi ) a 0 + (∑X i 2 ) a 1 = ∑(X i, Y i) ( 式 1-7)
得到的两个关于 a0 、 a1 为未知数的两个方程组,解这两个方程组得出:
a0 = (∑Y i)/ m - a 1(∑X i) / m ( 式 1-8)
a1 = [∑X i Y i - (∑X i ∑Y i)/ m] / [∑X i 2 - (∑X i) 2 / m)] ( 式 1-9)
这时把 a0 、 a1 代入 ( 式 1-1) 中 , 此时的 ( 式 1-1) 就是我们回归的元线性方程即:数学模型。
在回归过程中,回归的关联式是不可能全部通过每个回归数据点 (x1, y1 、 x2,y2...xm,ym), 为了判断关联式的好坏 , 可借助相关系数 “R” ,统计量 “F” ,剩余标准偏差 “S” 进行判断; “R” 越趋近于 1 越好; “F” 的绝对值越大越好; “S” 越趋近于 0 越好。
R = [∑XiYi -m (∑X i / m)(∑Y i / m)]/ SQR{[∑X i 2 - m (∑X i / m) 2][∑Y i 2 - m (∑Y i / m) 2]} ( 式 1-10) *
在 ( 式 1-1) 中, m 为样本容量,即实验次数; Xi 、 Yi 分别任意一组实验 X 、 Y 的数值。