Cox-Box变换

最新推荐文章于 2023-05-21 00:15:00 发布

sam-X

最新推荐文章于 2023-05-21 00:15:00 发布

阅读量3.2k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010945683/article/details/80310307

版权

机器学习专栏收录该内容

30 篇文章 3 订阅

订阅专栏

在《回归分析的基本假设》中提到了回归分析中的基本假设.这里的Box-Cox变换方法能够解决回归模型中的误差项不服从高斯分布的违例问题.通常这种违例情况出现在，误差 $\epsilon$ 与预测变量相关的时候，会影响模型结果的精确度.简单的方法就是通过对 $X$ 进行变换，如

\begin{matrix} (1) & \begin{aligned} y & = \sqrt{x} \\ y & = \frac{1}{x} \\ y & = \frac{1}{\sqrt{x}} \\ y & = l n (x) \end{aligned} \end{matrix}

$\begin{equation}\begin{split} y &= \sqrt{x} \\ y &= \frac{1}{x}\\ y &= \frac{1}{\sqrt{x}}\\ y &= ln(x) \end{split}\end{equation}$

当P值小于0.003时，由于普通数据转换方法很难使其实现正态化处理，运用Box-Cox变换方法对原数据进行正态化处理就表现出巨大的价值.当P值大于0.003时，两种变换方法均可，但优先考虑普通的平方变换.

Box-Cox变换是对反应变量y进行变换

y λ = {y λ - 1 λ, log (y), λ \neq 0 λ = 0

$y^\lambda= \begin{cases} \frac{y^\lambda-1}{\lambda}, &\lambda \neq 0\\ \log(y), &\lambda = 0 \end{cases}$

可以看出，y的Box-Cox变换是一个变换族. $\lambda$ 能够决定变换的具体形式.同时上式有暗含的条件即 $y>0$ .对于任意取值，则应该改为

y λ = ⎧ ⎩ ⎨ ( y + c ) λ - 1 g λ, log ( y + c ) g, λ \neq 0 λ = 0

$y^\lambda = \begin{cases} \frac{(y+c)^\lambda-1}{g\lambda}, &\lambda \neq 0\\ \frac{\log(y+c)}{g}, &\lambda = 0 \end{cases}$

方法优势

保持原始数据中数据的大小次序
转换函数连续
转换函数可导
函数族各函数之间随参数改变平滑过渡，且都经过一个公共点，以增强不同函数之间的可比性
函数族内每个函数在公共点两边的变化趋势有一定的对称性
函数族的曲线是按P值大小排序的，较大的P值对应的函数曲线位于较小P值得上方

$\lambda$ 值的确定

通过最大似然估计或者Bayes方法.

使用Box-Cox变换族一般都可以保证将数据进行成功的正态变换，但在二分变量或较少水平的等级变量的情况下，不能成功进行转换，这时可以使用广义线性模型，如Logustics模型、Johnson转换等.

本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 中国大陆许可协议进行许可。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
Cox-Box变换

在《回归分析的基本假设》中提到了回归分析中的基本假设.这里的Box-Cox变换方法能够解决回归模型中的误差项不服从高斯分布的违例问题.通常这种违例情况出现在，误差ϵϵ\epsilon与预测变量相关的时候，会影响模型结果的精确度.简单的方法就是通过对XXX进行变换，如yyyy=x−−√=1x=1x−−√=ln(x)(1)(1)y=xy=1xy=1xy=ln(x)\begin{equation}\...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。