大数据时代的到来,使得很多工作都需要进行数据挖掘,从而发现更多有利的规律,或规避风险,或发现商业价值。比如在支付领域,通过挖掘商户的交易数据,分析商户是否有欺诈、盗刷、赌博、套现等风险。对于有风险的商户,及时进行关闭处理,或者实时中断交易,从而保护个人的资金安全。在金融领域,通过客户的历史还款和多头借贷等数据,挖掘客户的还款能力和还款意愿,进行贷前评估。
本文和你一起探索数据挖掘常用的函数toad.metrics.KS_bucket。
一、安装toad包
首先打开cmd,安装toad包,安装语句如下:
pip install toad
若安装成功,会显示结果如下:
二、导入数据
背景:现需分析7252个客户的多头、关联风险、法院执行、风险名单和逾期信息,用于构建客户的贷前评分卡A卡。在进行评分卡搭建之前需要对客户的信息进行筛选,挑选出和客户逾期信息相关性高的变量。抽取部分指标用于本文的统计指标展示,具体分析如下。
接着导入需分析的数据。
#[