为便于工作中计算KS和IV等值,编写一套可以沿用的代码,方便随时使用。
#第一步,读取数据
import pandas as pd
import numpy as np
df=pd.read_excel(r'C:\Users\***\a.xlsx')
#第二步:查看所有字段的字段类型
df.dtypes
#新建一个DataFrame,记载各变量的数据类型,便于后续筛选
df_var=pd.DataFrame(df.columns,columns=['var'])
df_type=pd.DataFrame(df.dtypes,columns=['type'])
#合并
df_var_type=pd.merge(df_var,df_type,how='left',left_on='var',right_index=True)
#字符型变量
list_object=list(df_var_type[df_var_type['type']=='object']['var'])
#数值型变量
list_num=list(df_var_type[(df_var_type['type']=='int64')|(df_var_type['type']=='float64')]['var'])
#第三步:分箱函数:两个:cut和qcut,即等宽和等频