2017.08.03回顾

最新推荐文章于 2017-08-27 17:56:35 发布

strwolf

最新推荐文章于 2017-08-27 17:56:35 发布

阅读量282

点赞数 1

分类专栏：日记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/strwolf/article/details/76639362

版权

日记专栏收录该内容

290 篇文章

订阅专栏

今天的工作比较单纯，就是继续整理建模数据，从中也发现了数据中明显的错误，还有些数值型的错误还需要仔细check，没什么技术含量，今天比较有收获的是还是那个问题：是否变量分布越大，WOE变化也越大？

方法是采用模拟的形式，变量分成6类，固定每类的好坏比，固定总样本数，找到满足好坏比，总数约束，整数约束的一共79种分布，这其中33组的WOE唯一，46组WOE存在重复，所以分布变了，WOE不变的概率是多少呢？1%的概率不变，这个问题我还让了一手，因为我固定了每组好坏比，固定了总数，如果固定好坏比，不固定总数，那WOE更难不变，那如果好坏比和总数都不固定呢？固定总数是合理的，比如我真正放款了，我可以抽样出来和建模的总数一样，这时候分布可能和建模时候有了一些差异，可以计算一个PSI，那我现在假设好坏比不变，但现实中计算出Bt和Gt，很难有Bt+Gt=S，所以我们把S和好坏比都调成了比较整的形式，于是找到了79种分布，这个时候用33组独立的随便找一个为对照组，计算PSI变化和WOE变化的对应关系，WOE变化采用的是类MSE的形式，但是并没有展示出WOE的类MSE和PSI的同增同减，任选8组起始组，只有2组稍微有同增同减的趋势，难道我的猜想是错的？这个问题还有待研究！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。