dataframe生成虚拟变量

最新推荐文章于 2021-06-22 14:38:04 发布

mohana48833985

最新推荐文章于 2021-06-22 14:38:04 发布

阅读量635

点赞数

本文链接：https://blog.csdn.net/Caiqiudan/article/details/108167974

版权

# 分类变量
var_d = ['CODE_GENDER','FLAG_OWN_CAR', 'FLAG_OWN_REALTY', 'NAME_INCOME_TYPE',
       'NAME_EDUCATION_TYPE', 'NAME_FAMILY_STATUS', 'NAME_HOUSING_TYPE','FLAG_WORK_PHONE',
       'FLAG_PHONE', 'FLAG_EMAIL', 'OCCUPATION_TYPE','label', 'Xc_mortgage', 'Xc_annuity',
       'Xc_insurance_pay', 'Xc_loan_repay',]
       
df2 = pd.get_dummies(df1.loc[:,var_d],columns=var_d,drop_first=True) # drop_first:保留k-1个变量，第一个去掉