Python机器学习:replace()给字段值赋值

像“性别”这类数据尽量不要使用One Hot编码,因为One Hot编码后分成两个字段性别_是否男,性别_是否女,这两个字段是高度相关的,自变量具有相关关系也称为多重共线性,会影响预测的精度。那要怎么处理性别这类数据呢?

用repalce()把文本类型的赋值成数字类型的就可以啦:

data['is_male'] = data['Gender'].replace({'Female':0,'Male':1})

语法讲解:

Dataframe的数据格式可以接replace()这种方法;

replace()是方法名,是带括号的;

花括号是字典格式用来对多个值进行赋值,格式是:{原值:新值,原值:新值};

处理前后对比:

 

replace清洗数据的其他用法:

Python数据分析:用replace()替换数据_紫昂张的博客-CSDN博客_python数据替换

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值