简介
Box cox Transformation可以将非正态分布的独立因变量转换成正态分布,我们知道,很多统计检验方法的一个重要假设就是“正态性”,所以当对数据进行Box cox Transformation后,这意味着我们可以对我们的数据进行许多种类的统计检验。
Box-Cox变换是Box和Cox在1964年提出的一种广义幂变换方法,是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况。Box-Cox变换之后,可以一定程度上减小不可观测的误差和预测变量的相关性。
1964年,统计学家George Box和Sir David Roxbee Cox的论文上合作并开发了该技术。
Box, G. E. P. and Cox, D. R. (1964). An analysis of transformations, Journal of the Royal Statistical Society, Series B, 26, 211-252.
Box-Cox变换的主要特点是引入一个参数,通过数据本身估计该参数进而确定应采取的数据变换形式,Box-Cox变换可以明显地改善数据的正态性、对称性和方差相等性,对许多实际数据都是行之有效的。
Box Cox transformation的核心是指数λ。对于不同分布形式的数据,λ的取值不同,但取值范围都是[-5,5].The “optimal value” is the one which results in the best approximation of a normal distribution curve. The transformation of y has the form: