pd.get_dummies的用法

import pandas as pd
df = pd.DataFrame({'A':['a','b','a'],'B':['c','d','e'],'C':[1,2,3]})
In [6]: df
Out[6]:
   A  B  C
0  a  c  1
1  b  d  2
2  a  e  3

In [7]: pd.get_dummies(df)
Out[7]:
   C  A_a  A_b  B_c  B_d  B_e
0  1    1    0    1    0    0
1  2    0    1    0    1    0
2  3    1    0    0    0    1
In [8]: pd.get_dummies(df,prefix=['col1','col2'])
Out[8]:
   C  col1_a  col1_b  col2_c  col2_d  col2_e
0  1       1       0       1       0       0
1  2       0       1       0       1       0
2  3       1       0       0       0       1

从上面我们会发现在DataFrame中数字部分不会进行one-hot编码

df1 = pd.Series([1,2,3])

In [10]: df1
Out[10]:
0    1
1    2
2    3
dtype: int64

In [11]: pd.get_dummies(df1)
Out[11]:
   1  2  3
0  1  0  0
1  0  1  0
2  0  0  1

但是对于Series数字部分会进行one-hot编码

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值