2-3 常用的数据转换方法

2-3 常用的数据转换方法

数据标准化是将数据按比例缩放到一个特定区间,其主要包括数据同趋化处理和无量纲化处理两个方面。数据标准化的方法有很多种,常用的有最小-最大标准化和z-score标准化。

请用户对本题中的变量(不包括变量ID)进行z-score标准化,标准化公式如下:
在这里插入图片描述

数据说明
本题数据来自KEEL,数据集一共包含1列ID,4列特征变量,共100个样本点。
在这里插入图片描述

预设变量
本题使用的数据变量名、含义及其类型如下:

变量名含义类型
data数据集DataFrame

答题要求
对data中的列(不包括变量ID)进行z-score标准化,类型为DataFrame对象。

正误判定变量data

方法一:

import pandas as pd

data['CT']=data['CT'].map(lambda x: (x-data['CT'].mean())/data['CT'].std())

data['FA']=data['FA'].map(lambda x: (x-data['FA'].mean())/data['FA'].std())

data['WT']=data['WT'].map(lambda x: (x-data['WT'].mean())/data['WT'].std())

data['SP']=data['SP'].map(lambda x: (x-data['SP'].mean())/data['SP'].std())

data=pd.DataFrame(data)

方法二:

import pandas as pd
continuous_columns = ['CT','FA','WT','SP']
data[continuous_columns] = data[continuous_columns].apply(lambda x : (x-x.mean())/x.std())
print(data.head())

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值