pd.get_dummies相当于onehot编码,常用与把离散的类别信息转化为onehot编码形式。
官方文档:
def get_dummies(data,
prefix=None,
prefix_sep='_',
dummy_na=False,
columns=None,
sparse=False,
drop_first=False,
dtype=None)
Demo:
import pandas as pd
df = pd.DataFrame([
['green', 'A'],
['red', 'B'],
['blue', 'A']])
df.columns = ['color', 'class']
#print(df)
输出:
df=pd.get_dummies(df,columns=["color"])
print(df)