点击蓝字关注我们
非线性回归分析
概述
按照自变量和因变量之间的关系类型,回归分析可分为线性回归分析和非线性回归分析。非线性回归的回归参数不是线性的,也不能通过转换的方法将其变为线性。
原理
非线性回归是用来建立因变量与一系列自变量之间的非线性关系,与估计线性模型的线性回归不同,通过使用迭代估计算法,非线性回归可估计自变量和因变量之间具有任意关系的模型。
对于看起来是非线性的模型,但是可以通过变量转换化成线性的模型,称之为本质线性模型,例如
只要两边取自然对数,方程就可以写成
有的非线性模型不能通过简单的变量转换化成线性模型,称之为本质非线性模型,例如
对于可以通过定义和转换能变成线性关系的本质线性模型,可以采用线性回归来估计这一模型,对于不能转换成线性模型的本质非线性模型,就要采用非线性模型进行分析。
模型
实例及操作
本节案例是多个公司广告费用和销售量的一些资料。现要求利用广告费用对销售量拟合非线性回归方程。
1、数据的初步分析
选择“图形”→“图形构建器”,弹出“图形构建器”对话框,在左下角“选择范围”中选择“散点图/点图”,将“广告费用”拖入x轴,将“销售量(万)”拖入y轴,单击“确定”按钮,输出结果如下图所示,可见当x值刚开始增加时,y值迅速增加,x值持续增加时,y值增速减弱,并最终趋于平稳,故选择Metcherlich Law of Diminishing模型。
参数初始值的选择
b1代表了销售量上升的最大值,结合图和数据发现最大值接近13,因此设定的初始值为13。
b2是当x=0时,y值减去得到的值,有数据可知,当x=0时,y值为2,故的初始值为-11。
b3的初始值可以用图中两个点的斜率来表示,取两个点(2.15.8.75)、(5.75,12.74),得到斜率为1.1,故的初始值为1.1。
2、打开后台获取的数据文件,选择“分析”→“回归”→“非线性”,弹出“非线性回归”对话框。
3、在左侧的变量列表中选中“销售量(万)”变量,单击“选入”按钮,将其选入“变量列表”,在模型表达式框中编辑模型表达式: b1+b2*EXP(-b3*广告费用)。
4、单击“参数”按钮,弹出 “非线性回归:参数”对话框,对b1、b2、b3三个参数进行定值,分别为:“b1=13”、“b2=-11”、“b3=1.1",单击“继续”按钮返回主对话框。
5、单击“损失”按钮,弹出 “非线性回归:损失函数”对话框,使用系统默认的残差平方和,单击“继续”按钮返回主对话框。
6、单击“约束”按钮,弹出 “非线性回归:参数约束”对话框,在参数列表中选择b1 (13)进入表达式编辑区,选择逻辑符号“>=”, 然后在右边的输入框中输入“0”,单击“添加”按钮,将“b1>=0"加入约束条件列表,同理加入“b2<=0”、 “b3>=0”,单击“继续”按钮返回主对话框。
7、单击“保存”按钮,弹出 “非线性回归:保存”对话框,勾选“预测值”和“残差”复选框,单击“继续”按钮返回主对话框。
8、单击“选项”按钮,弹出“非线性回归:选项”对话框,设置均选择系统默认,单击继续按钮返回主对话框。
结果分析
1、迭代历史记录
从上表可以看出模型经过11次迭代得到最优解。
2、参数估计值
从上表可以得到参数b1、b2、b3的值,分别为12.866,-11.690,0.477,得到非线性模型
从标准错误列表中发现b1、b2、b3的标准误都很小,所以3个参数的估计值都是可信的。
3、参数估计值相关性
从上表可以看出3个参数估计值之间的相关性。
4、ANOVA
从上表可以得到方差分析的结果,R方≈0.959,可见模型能解释95.9%的变异,说明模型的拟合效果很好。
注:后台回复【非线性回归分析】获取案例中的数据。
参考资料:
李昕,张明明.SPSS 22.0统计分析[M].北京:电子工业出版社,2015.
▇ 扫码关注我们
图文:王吉庆
排版:王吉庆