学习笔记1-归一化与标准化

"标准化"和"归一化"这两个中文词要指代四种Feature scaling(特征缩放)方法:

1.Rescaling (min-max normalization)

也被称为最大-最小缩放(min-max scaling)或最小-最大归一化(min-max normalisation),最为简单。

x'={\frac  {x-{\text{min}}(x)}{​{\text{max}}(x)-{\text{min}}(x)}}

2.Mean normalization(均值归一化)

{\displaystyle x'={\frac {x-{\text{average}}(x)}{​{\text{max}}(x)-{\text{min}}(x)}}}

3.Standardization(标准化)

x' = \frac{x - \bar{x}}{\sigma}

其中,x是原始特征向量,{\bar {x}}是特征向量的平均值,\sigma是其(应该是原始特征向量集合)标准偏差。

4.Scaling to unit length(缩放到单位长度)

x'={\frac  {x}{||x||}}

 

归一化

标准化 (统计学)

在统计学里有着各种不同的标准化方案。参见下表所示:

名字公式使用
标准分数

{\frac  {X-\mu }{\sigma }}

用来标准化误差,当总体参数是已知时。
T-统计量{\frac  {X-\overline {X}}{s}}用来标准化残差,当总体参数是未知时(或估计时)。
学生化残差{\frac  {​{\hat  \epsilon }_{i}}{​{\hat  \sigma }_{i}}}={\frac  {X_{i}-{\hat  \mu }_{i}}{​{\hat  \sigma }_{i}}}用来标准化残差,当参数的值为估算时,特别是在回归分析中跨越不同数据点.
标准化矩{\frac  {\mu _{k}}{\sigma ^{k}}}用来标准化中心矩,使用标准偏差作为衡量规模。
变异系数{\frac  {\sigma }{\mu }}标准化离散量,是概率分布离散程度的一个归一化量度,其定义为标准差\ \sigma平均值\ \mu之比.

 

作用:http://www.cnblogs.com/zhaokui/p/5112287.html

https://en.wikipedia.org/wiki/Normalization_(statistics)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值