import pandas as pd
import numpy as np
import toad
df = pd.read_csv(‘应还订单的模型分布情况3.24.csv’)
数据分布情况
bins = 15
ts_bucket = toad.metrics.KS_bucket(df[‘complexScore’],df[‘y’],bucket=bins,method=‘quantile’)
ts_bucket
新的overdue
df[‘y1’] = df.apply(lambda x: 0 if x[‘risk_DaysOverdue’]❤️ and x[‘y’]==0 else 1, axis=1)
某一个列的平均值
统计某一列的元素出现次数
将文件进行压缩(解压的时候也需要加入compression=‘gzip’)
.to_csv(‘XXX.csv’,index=False,compression=‘gzip’)