心脏病题目(2)数据预处理

一、幅度调整,归一化

  • Age,Trestbps,chol,thalach,oldpeak(连续参数)属于数据比较集中的类型,可用MAXMIN进行标准化处理。
from sklearn import preprocessing
col = data[['age','trestbps','chol','thalach','oldpeak']]
min_max_scaler = preprocessing.MinMaxScaler()
col_min_max = min_max_scaler.fit_transform(col)
col_min_max = pd.DataFrame(col_min_max)
col_min_max.columns = ['age','trestbps','chol','thalach','oldpeak']
  • cp,slope,restecg,thal进行onehot编码
OneHot_cp = pd.get_dummies(data.cp,prefix='cp').astype('float')
OneHot_restecg = pd.get_dummies(data.restecg,prefix='restecg').astype('float')
OneHot_slope = pd.get_dummies(data.slope,prefix='slope').astype('float')
OneHot_ca = pd.get_d
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值