在学习或者使用机器学习的方法时,回归分析可以说是最常用的一种方法了。今天朋友推荐Dr. Paul Allison的一篇博文,讲回归分析最常用的两种方式:预测和因果分析。觉得对医学信息学里面对回归分析的使用有很大的帮助,于是拜读了一下。下面是对于其中主要观点的总结。Dr. Allison是统计学方面的大牛,写了很多本统计学方面的书。最厉害的是他的教学。不管面对什么样的学生,他都能很有效地教授统计学方法。
对我来说,本文的最大贡献是:指出了回归分析的两个用途(预测和因果分析)应当分开对待。在医学信息学领域,回归分析一般被用来做疾病风险预测模型建模,以及评估模型中的变量对最终临床结局的影响。而从本文中可以推测的是:我们并不能期望一个风险预测模型,能同时回答这两种用途所针对的问题。原因就是用途不一样,进行回归分析的很多方面的设计和考量就不一样。Dr.Allison在文中列举了5大需要区别对待的地方。