MachineLearning&DeepLearning:数据预处理

MachineLearning&DeepLearning:数据预处理

一、最大最小规范化(sklearn-preprocessing

1. MinMaxScaler:[0, 1]

a = np.array([1.0, 2.0, 3.0, 4.0]).reshape((2, 2))
m = MinMaxScaler()
print(m.fit_transform(a))
b = np.array([2.0, 5.0]).reshape((1, -1))
print(m.transform(b))
image-20200903152253991

2.MaxAbsScaler:[-1, 1]

​ 原理与上面的很像,只是数据会被规模化到[-1,1]之间。也就是特征中,所有数据都会除以最大值。这个方法对那些已经中心化均值维0或者稀疏的数据有意义。MaxAbsScaler 和 maxabs_scale这两个方法是专门为稀疏数据的规模化所设计的。

二、 标准化(sklearn-preprocessing

Standardization标准化:将特征数据的分布调整成标准正态分布(高斯分布),也就是使得数据的均值维0,方差为1.

标准化的原因在于如果有些特征的方差过大,则会主导目标函数从而使参数估计器无法正确地去学习其他特征

​ 标准化的过程为两步:去均值的中心化(均值变为0);方差的规模化(方差变为1)。

image-20200903153224199

image-20200903153730169

三、正则规范化

image-20200903155405837

四、Box-Cox变换

image-20200903201905284

针对标签进行变换,使之分布更加趋向于高斯分布。常量c可以设置为1, λ \lambda λ参数控制变换形式,可以囊括幂函数、对数函数、线性函数等.

dn.net/weixin_40807247/article/details/82793220

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值