Pandas:类别变量向量化--get_dummies

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

一、向量化

df = DataFrame({'key':['b','b','a','c','a','b'],
               'data1':range(6)})
print(df)
   data1 key
0      0   b
1      1   b
2      2   a
3      3   c
4      4   a
5      5   b
print(pd.get_dummies(df['key']))
   a  b  c
0  0  1  0
1  0  1  0
2  1  0  0
3  0  0  1
4  1  0  0
5  0  1  0

二、与原始数据合并

dummies = pd.get_dummies(df['key'],prefix = 'key')
df_with_dummy = df[['data1']].join(dummies)
print(df_with_dummy)
   data1  key_a  key_b  key_c
0      0      0      1      0
1      1      0      1      0
2      2      1      0      0
3      3      0      0      1
4      4      1      0      0
5      5      0      1      0
阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/bqw18744018044/article/details/79964741
个人分类: Pandas
上一篇Pandas:随机重排列和随机采样--permutation和take
下一篇Pandas:重塑(stack)和轴向旋转(pivot)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭