数据规范中的归一化(Normalization)与标准化(Standardization)

归一化和标准化是数据预处理的重要步骤,主要用于处理数据的尺度和范围。归一化通常将数据限制在[0, 1]之间,而标准化则将数据转化为均值为0,方差为1的分布。奇异样本数据可能导致训练时间增加或网络无法收敛,因此常需归一化。在Matlab中,可以使用mapminmax、premnmx等函数进行归一化,mapminmax还支持数据还原。归一化和标准化对于不同性质的数据处理、无量纲化和提高计算效率具有重要意义。" 108095794,9393772,Hive函数详解:从关系运算到复杂类型操作,"['Hive', '大数据']
摘要由CSDN通过智能技术生成

A.归一化 vs. 标准化

归一化:要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。一般指将数据限制在[0 1]之间。

(1)把数变为(0,1)之间的数,主要是为了数据处理方便提出来的,把数据映射到0-1之间处理,更便携快速;
(2)把有量纲表达式变为无量纲表达式,成为纯量;
(3) 一般采用最大-最小规范化对原始数据进行线性变换:X*=(X-Xmin)/(Xmax-Xmin)

标准化:对原始数据进行缩放处理,限制在一定的范围内。一般指正态化,即均值为0,方差为1。即使数据不符合正态分布,也可以采用这种方式方法,标准化后的数据有正有负。
由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。

(1)数据同趋化处理:解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果;
(2)无量纲化处理:要解决数据的可比性;
(3)一般采用Z-score规范化:即均值为0,方差为1的正态分布;

在matlab里面ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值