数据预处理-对数变换

最新推荐文章于 2024-08-07 15:56:54 发布

Jian_h

最新推荐文章于 2024-08-07 15:56:54 发布

阅读量4k

点赞数 1

分类专栏：机器学习文章标签：机器学习数据分析

本文链接：https://blog.csdn.net/Jian_h/article/details/105081281

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

当数据发生倾斜时，可以使用特征工程技巧，利用统计或数学变换来减轻数据分布倾斜的影响。使原本密集的区间的值尽可能的分散，原本分散的区间的值尽量的聚合。

log 变换通常用来创建单调的数据变换。它的主要作用在于帮助稳定方差，应用 log 变换会倾向于拉伸那些落在较低的幅度范围内自变量值的范围，倾向于压缩或减少更高幅度范围内的自变量值的范围。从而使得倾斜分布尽可能的接近正态分布并使得数据与分布的平均值无关。
在这里插入图片描述
λ通常设置为1，c通常设置使用欧拉常数 e。