【Python】算法初级-数据标准化

数据标准化应用在建模前期-数据预处理阶段。

数据标准化的目的是使各指标处于同一量级。

要求数据标准化的模型有:线性回归Linear Regression、逻辑回归Logistic Regression、支持向量机SVM、神经网络Neutral Network等。原因还没太理解,后面再补充。

数据标准化的方法有:
线性函数归一化(Min-Max Scaling)
零均值归一化(Z-score normalization)

  • 归一化是标准化的一种。

(1)线性函数归一化(Min-Max Scaling)
对原始数据进行线性变换,将值映射到[0,1]区间,等比例缩放原始数据。
公式:
在这里插入图片描述

(2)零均值标准化(Z-score normalization)
将原始数据映射到均值μ 为0,标准差σ 为1的正态分布即高斯分布上。
假设原始数据的均值为μ,标准差为σ。公式:
在这里插入图片描述

z-score标准化要求原始数据近似服从高斯分布,只有原始数据近似服从高斯分布,才能把原始数据映射到均值为0、标准差为1的z分布上。如果不服从高斯分布,不适合用z-score标准化。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值