Python每日一记20>>>哑变量

“对于特定应用,如何找到最佳数据表示,这个问题被称为特征工程”
特征工程是数据科学家和机器学习从业者在尝试解决现实问题的主要任务之一,用正确的方式表达数据,对于大部分算法的影响比选择正确的参数还要重要。
连续性数据可以较好的用于建模,但是打不分模型并不支持分类性变量(如男女,好坏等)的建模,因此需要对其进行编码处理,转化为数值型变量,这种转化称为哑变量转换或者虚拟变量转换。
首先我们可以检查一下数据的某一列分类变量的个数:data[ ].value_counts 这个函数会统计类别的个数,如男:89,女:90
然后我们再进行哑变量处理:
pandas.get_dummies(data,columns=[ ]),正常情况下,默认不对数值型变量进行处理,但如果指定了列,则会强制进行转换。转换类似于下图:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值