# 分类变量
var_d = ['CODE_GENDER','FLAG_OWN_CAR', 'FLAG_OWN_REALTY', 'NAME_INCOME_TYPE',
'NAME_EDUCATION_TYPE', 'NAME_FAMILY_STATUS', 'NAME_HOUSING_TYPE','FLAG_WORK_PHONE',
'FLAG_PHONE', 'FLAG_EMAIL', 'OCCUPATION_TYPE','label', 'Xc_mortgage', 'Xc_annuity',
'Xc_insurance_pay', 'Xc_loan_repay',]
df2 = pd.get_dummies(df1.loc[:,var_d],columns=var_d,drop_first=True) # drop_first:保留k-1个变量,第一个去掉
dataframe生成虚拟变量
最新推荐文章于 2021-06-22 14:38:04 发布