Generalized additive model (简称GAM)在1986年由Hastie & Tibshirani发表以后,一直被应用于许多领域,如环境科学、医学、生物统计,在方法上也得到发展,如Amato等人(2002)提出的基于傅立叶变换最优逼近模式估计,Sardy(2003)基于非线性小波估计方法,范剑青2004年提出的基于核函数的广义可加模型估计以及基于GLR的统计推断,对可加模型的估计和统计推断做了进一步的发展,而且在应用上该方法也被拓展到经济金融领域,Wensui Liu在2007年提出了基于GAM的信用评分模型改进无疑是该方法在金融实践中的一个成功的尝试,在不久的将来也许非参数计量将会是下一代计量理论体系的核心补丁。
下面说说GAM方法的优势,首先它没有参数方法对先验分布的限制前提(如normalassumption、homoscedasticity assumption),其次在处理非线性模式的能力要远远强于参数模型,当然新的模式出现也会给我们的应用增添一些疑惑,比如在可加成分是否显著或如何判断自变量与因变量间是线性还是非线性模式,基于这个问题,理论学者和应用大牛们也都分别给出了相应的方法和尝试,比如范剑青的GLR检验、profile least-squares estimation,Hastie的Back-Fitting and Local Scoring Algorithms,他们的方法本质上都是基于非参数部分的局部分解以及整体模式残差最小的思想,如果因变量是二分变量估计方法相应替换成似然方法便是。
接下来给出相应的估计和检验方法,之前博客里已经给出范剑青的核方法的半变系数非参数模型的估计和检验程序(理论可以参考Profile Likelihood inferences on Semiparametric Varying-coeffcient Partially Liner Models),接下来介绍基于SAS集成的程序(更灵活简单)。
先介绍下GAM 基本的概念。一般线性模式可如下所示:
E(Y)=b0+b1*X1+b2*X2+...+bp*Xp
但在 GAM 下,模式相应改为:
E(Y)=s0+s1(X1)+s2(X2)+...+sp(Xp)
其中 si(Xi) 为smooth function