数据分析——数值标准化

最新推荐文章于 2024-04-18 13:10:03 发布

总是重复名字我很烦啊

最新推荐文章于 2024-04-18 13:10:03 发布

阅读量1.8k

点赞数 2

分类专栏：数据分析实战（含机器学习）文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/D_Ddd0701/article/details/114524360

版权

数据分析实战（含机器学习）专栏收录该内容

4 篇文章 8 订阅

订阅专栏

数据分析——数值量纲化

引例
常用方法

引例

我们在进行多维度数据分析的时候，可能会遇到这样的情况：
例如分析某地区银行客户存款结构情况，可能会受到很多潜在因素考虑，例如地区的教育水平、地区的房价水平、人均收入、客户的基本收入情况、客户的家庭情况、地区的综合医疗服务水平等等，那实际上用户存款是100万还是500万和用户家里面有几个老人需要赡养的相关度并没有其他因素的相关度那么高，所以，要把这些数据进行降维、收敛化处理——数值的量纲化处理。

常用方法

这里只列举出方法，具体的应用后期再整理。

标准化（常用）

标准化针对数据进行了压缩处理，使得数据平均值为0，标准差为1。
在这里插入图片描述

归一化（常用）

归一化让所有的数据均压缩在 [0, 1]，使数据之间的数理单位保持一致。
在这里插入图片描述

均值化

以平均值作为单位，全部数据均除以平均值。（必须所有数据都大于0）
在这里插入图片描述

正向化

对正向指标保持正向且量纲化，使得数据压缩在[0, 1]。
在这里插入图片描述

逆向化

对逆向指标保持正向且量纲化，使得数据压缩在[0, 1]。
在这里插入图片描述
实际上正向化和逆向化都是归一化都一种。使用场景举例：
某商场活动邀请了很多人来免费参加体验活动，后面有一部分人购买了产品（正向化），也有一部分没有购买（逆向化），实际上正向化在这里就是用户转化率，逆向化就是流失率，我们希望正向化越大越好，逆向化越小越好。

区间化

统一量纲，数据区间化。
在这里插入图片描述
区间化的方法从高等数学定积分的内容中衍生出来，可以对数据落定区间进行个性化处理。

总是重复名字我很烦啊

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
数据分析——数值标准化

数据分析——数值量纲化
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

总是重复名字我很烦啊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。