R语言处理非线性回归模型C-D方程,【译文】R语言非线性回归入门-CSDN博客

作者 Lionel Hertzog

译者钱亦欣

在一簇散点中拟合一条回归线(即线性回归)是数据分析的基本方法之一。有时，线性模型能很好地拟合数据，但在某些(很多)情形下，变量间的关系未必是线性的。这时，一般有三类方法解决这个问题: (1) 通过变换数据使得其关系线性化, (2) 用多项式或者比较复杂的样条来拟合数据, (3) 用非线性函数来拟合数据

从标题你应该已经猜到非线性回归是本文的重点

什么是非线性回归

在非线性回归中，分析师通常采用一个确定的函数形式和相应的参数来拟合数据。最常用的参数估计方法是利用非线性最小二乘法(R中的nls函数)。该方法使用线性函数来逼近非线性函数，并且通过不断迭代这个过程来得到参数的最优解(本段来自维基百科)。非线性回归的良好性质之一是估计出的参数都有清晰的解释(如Michaelis-Menten模型的Vmax是指最大速率)，而变换数据后得到的线性模型其参数往往难以解释。

非线性最小二乘拟合

首先，我们以Michaelis-Menten方程为例。# 生成一些仿真数据

set.seed(20160227)

# 对于一些简单的模型，nls函数可以自动找到合适的参数初值

# 计算模型的拟合优度

cor(y, predict(m))

[1] 0.9496598

# 将结果可视化

plot(x, y)

lines(x, predict(m), lty = 2, col = "red", lwd = 3)

输出的图片如下：

选择适宜的迭代初值

在非线性回归中，找到合适的迭代初值对于整个模型算法的收敛性而言至关重要。假如你设定的参数初值完全脱离了其潜在的取值范围，迭代算法可能不收敛或者返回一些没有意义的参数值。比如返回一个大小为1000的增长率，但其真值却是1.04。寻找合适初值的最好办法是“紧盯着”数据，绘制相应图表并结合你对方程的理解来确定参数的合适初值。# 生成仿真数据，并且此次对于参数没有先验信息

# 可视化数据并选择一些参数初值

plot(x, y)

# 通过这个散点图确定参数a, b的初值

a_start

b_start

# 拟合模型

# 计算拟合优度

cor(y, predict(m))

[1] 0.9811831

# 将结果可视化

lines(x, predict(m), col = "red", lty = 2, lwd = 3)

输出的图片如下：