在统计分析中,变量与变量之间的关系并不均为线性相关。人体测量指标间往往呈现出更为复杂的变化关系,如男性碱性磷酸酶(ALP)水平随年龄的增长在13岁左右达到高峰,随后成断崖式的下降,并剩余的时间里趋于稳定(图1)。面对这一情况,如果采用线性相关去描述ALP与年龄之间的关系,则很容易忽视上述特征。此时,我们可以利用非参数回归方法去描述二者之间的关系。
在本节中,我们将分享利用一个简单的函数,用来描述变量间的非线性相关关系并绘制数据分布热图。
以图2为例,该图对应的原始数据集中仅包括ALP和年龄(year)两个变量。如需绘制图2,我们需要用到gamlss和gamlss.util包(该包的其他详细用法参见https://www.gamlss.com)。具体的代码如下:
library(gamlss)
library(gamlss.util)
- 构建LMS模型(该模型为GAMLSS方法下的一个特例)
m0a<-lms(ALP,year,data=dat