数据预处理之数据标准化

数据预处理中的数据标准化是消除特征比重不平衡的关键步骤。常见的方法包括最大-最小标准化、零-均值标准化(标准差标准化)和小数定标标准化。最大-最小标准化将数据映射到[0,1]区间,但易受极端值影响;零-均值标准化使数据转化为标准正态分布,便于算法应用;小数定标标准化则通过调整小数位数确保数据在[0,1]范围内。" 129879111,9439443,Markdown文档预览与安全解析,"['前端开发', 'markdown解析', 'HTML渲染', '安全防护', 'JavaScript库']
摘要由CSDN通过智能技术生成

数据标准化的意义

在对数据集建模前,常常要对数据的某一特征或几个特征进行规范化处理,其目的在于将特征值归一到同一个维度,消除比重不平衡的问题。

常用的标准化方法有 最大-最小标准化零-均值标准化小数定标标准化

最大-最小标准化

最大-最小标准化又称为离差标准化,将原始数据进行线性变换,映射到[0,1]区间。
转换公式如下:

max-min 标准化

其中,max为特征中最大的值,min为特征中最小的值。max-min表示极差。

这种标准化的优点是实现简单、保留了原始数据之间的关系。

缺点也很明显,即:
1.当样本中的max过大时,会使得标准化后各值之间相差不大,无法准确表示样本间的差异;
2.当新加入的样本的值大于max或小于min,会使标准化产生混乱,即每当有新样本导入时,必须重新计算max和min。

零-均值标准

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值