def preprocessing(dfdata):
dfresult= pd.DataFrame()
#Pclass
dfPclass = pd.get_dummies(dfdata['Pclass'])
dfPclass.columns = ['Pclass_' +str(x) for x in dfPclass.columns ]
dfresult = pd.concat([dfresult,dfPclass],axis = 1)
return(dfresult)
Pclass
原来的取值是1,2,3,转换后变成了Pclass_1
,Pclass_2
,Pclass_3
三个one-hot形式的列。