get_dummies函数介绍

pd.get_dummies相当于onehot编码,常用与把离散的类别信息转化为onehot编码形式。

官方文档:

def get_dummies(data, 
                prefix=None, 
                prefix_sep='_', 
                dummy_na=False,
                columns=None,
                sparse=False,
                drop_first=False,
                dtype=None)

Demo:

import pandas as pd
 
df = pd.DataFrame([
    ['green', 'A'],
    ['red', 'B'],
    ['blue', 'A']])
 
df.columns = ['color', 'class']
#print(df)

输出:
在这里插入图片描述

df=pd.get_dummies(df,columns=["color"])
print(df)

在这里插入图片描述

  • 23
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
get_dummies函数是一个用于将分类变量转换为数值变量的函数。该函数将分类变量转换成哑变量(dummy variable)或指示变量(indicator variable),并将其编码为0或1。这个函数可以将分类变量转换为数值变量,以便于进行机器学习算法的处理。 get_dummies函数的语法格式如下: ```python pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None) ``` 参数说明: - data:需要转换的数据; - prefix:指定新的列名前缀; - prefix_sep:指定新的列名前缀的分隔符; - dummy_na:是否将缺失值也转换为哑变量,默认为False; - columns:指定需要转换的列; - sparse:是否以稀疏矩阵的形式返回,默认为False; - drop_first:是否删除第一个哑变量列,默认为False; - dtype:指定返回的数据类型。 示例代码: ```python import pandas as pd data = pd.DataFrame({'color': ['red', 'green', 'blue', 'green', 'red']}) # 将color列转换为哑变量 data_dummies = pd.get_dummies(data['color'], prefix='color') # 将哑变量添加到原数据集中 data = pd.concat([data, data_dummies], axis=1) print(data) ``` 输出结果: ``` color color_blue color_green color_red 0 red 0 0 1 1 green 0 1 0 2 blue 1 0 0 3 green 0 1 0 4 red 0 0 1 ``` 上面的示例代码中,首先定义了一个包含color列的数据集,然后使用get_dummies函数将color列转换为哑变量,最后将哑变量添加到原数据集中。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值