sklearn数据预处理之标准化和归一化 学习笔记

本文介绍了数据预处理中的两种重要方法:标准化(Z-score normalization,均值μ=0,标准差σ=1)和归一化(Min-Max scaling)。强调了在使用matplotlib作图时,plt.tight_layout()的重要性,用于自动调整子图参数。同时,还讲解了如何在plot中输入数学符号μ和σ。通过实例展示了数据处理前后分布的保持一致,强调了在机器学习中,训练集和测试集须进行相同处理的原则。
摘要由CSDN通过智能技术生成

对原始数据进行处理 , 有两种方法 :

  • 1: 标准化standardization ( 或者叫做Z-score normalization ) , 均值 μ = 0 \mu=0 μ=0 , 标准差 σ = 1 \sigma=1 σ=1

在这里插入图片描述
标准化公式

  • 2: 归一化Min-Max scaling ( 或者叫做normalization )

在这里插入图片描述

注意点:

1: 标准化和归一化代码:

from sklearn import preprocessing

# 标准化
std_scale = preprocessing.StandardScaler().fit( df[['A', 'B'...]] )
df_std = std_scale.transform( df[['A', 'B'...]] )

# 归一化
minmax_scale = preprocessing.MinMaxScaler().fit( df[['A', 'B'...]] )
df_minmax = minmax_scale.transform(df[['A', 'B'...]]  
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值