pandas.get_dummies函数 新增列类型

本文介绍了Pandas库中的get_dummies函数,用于将类别型特征转换为独热编码。重点讨论了从Pandas1.6.0版本开始,函数默认输出类型由numpy.uint8变为numpy.bool,以及如何通过dtype参数将其改为int类型。
摘要由CSDN通过智能技术生成

粘贴一下原函数,该函数主要用于对类别型特征做 One-Hot 编码(独热编码)

# date:类似数组、系列或数据帧
# dtype:新列的数据类型,只允许使用单个 dtype,默认布尔值
pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)

get _ Dummies 函数在 Pandas1.6.0版本之前返回 numpy.uint8,无符号八位整数。
在1.6.0版本开始更改为默认返回 numpy.bool ,numpy 布尔值。

import pandas as pd
df = pd.DataFrame([
            ['green' , 'A'],
            ['red'   , 'B'],
            ['blue'  , 'A']])
#我们这里形成一个(3,2)的dataframe
df.columns = ['color',  'class'] 
pd.get_dummies(df) 

输出新增列默认是布尔类型
在这里插入图片描述
修改一下代码,增加参数dtype=int

import pandas as pd
df = pd.DataFrame([
            ['green' , 'A'],
            ['red'   , 'B'],
            ['blue'  , 'A']])
#我们这里形成一个(3,2)的dataframe
df.columns = ['color',  'class'] 
pd.get_dummies(df,dtype=int) 

输出:新增列类型变为了int类型
在这里插入图片描述
官方文档:点击

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值