规范化

最新推荐文章于 2024-07-18 19:10:04 发布

Alexander plus

最新推荐文章于 2024-07-18 19:10:04 发布

阅读量387

点赞数

分类专栏：数据挖掘文章标签：数据挖掘

原文链接：https://blog.csdn.net/weixin_38706928/article/details/80329563

版权

数据挖掘专栏收录该内容

20 篇文章 0 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

数据规范化

数据规范化（归一化）处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲，数值见的差别可能很大，不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。如将工资收入属性值映射到[-1, 1]或者[0, 1]内。

== 数据规范化对于基于距离的挖掘算法尤为重要。==

最小-最大规范化

最小-最大规范化也称为离散标准化，是对原始数据的线性变换，将数据值映射到[0, 1]之间。

转换公式如下：
$\over (max - min) }* (max_{new} - min_{new}) + min_{new}$

离差标准化保留了原来数据中存在的关系，是消除量纲和数据取值范围影响的最简单方法。这种处理方法的缺点是若数值集中且某个数值很大，则规范化后各值接近于0，并且将会相差不大。（如 1， 1.2， 1.3， 1.4， 1.5， 1.6，8.4）这组数据。若将来遇到超过目前属性[min, max]取值范围的时候，会引起系统报错，需要重新确定min和max。

零-均值规范化（z-score标准化）

$x^* = x - x_{ave}\over S_{标准差}$

小数定标规范化

$x^* = x \over10^k$
https://blog.csdn.net/weixin_38706928/article/details/80329563

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
规范化

数据规范化数据规范化（归一化）处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲，数值见的差别可能很大，不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。如将工资收入属性值映射到[-1, 1]或者[0, 1]内。== 数据规范化对于基于距离的挖掘算法尤为重要。==最小-最大规范化最小-最大规范化也称为离散标准化，是对原始数据的线性变换，将数据值映射到[0, 1]之间。转换
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。