Pandas:类别变量向量化--get_dummies

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/bqw18744018044/article/details/79964741
import numpy as np
import pandas as pd
from pandas import Series,DataFrame

一、向量化

df = DataFrame({'key':['b','b','a','c','a','b'],
        'data1':range(6)})
print(df)
  data1 key
0   0  b
1   1  b
2   2  a
3   3  c
4   4  a
5   5  b
print(pd.get_dummies(df['key']))
  a b c
0 0 1 0
1 0 1 0
2 1 0 0
3 0 0 1
4 1 0 0
5 0 1 0

二、与原始数据合并

dummies = pd.get_dummies(df['key'],prefix = 'key')
df_with_dummy = df[['data1']].join(dummies)
print(df_with_dummy)
  data1 key_a key_b key_c
0   0   0   1   0
1   1   0   1   0
2   2   1   0   0
3   3   0   0   1
4   4   1   0   0
5   5   0   1   0

没有更多推荐了,返回首页

私密
私密原因:
请选择设置私密原因
 • 广告
 • 抄袭
 • 版权
 • 政治
 • 色情
 • 无意义
 • 其他
其他原因:
120
出错啦
系统繁忙,请稍后再试

关闭