1、上周五我想的第一个问题是分类变量不通过woe编码,直接数字编码来拟合logistic,但是怎么来确定这个数字呢?比如一个三类变量,可以是1、2、3,也可以是1、20000、30000,我搜了下没有找到解答,我没有想到这个问题的解答,我记得以前二分类变量直接是编码成1和0进行logistic回归
2、excel求分位数,percentile(A,B),A参数是范围,B是多少分位
3、excel底数为e的指数,为exp(A)
4、模型出来后,开始绘制roc curve和lift curve,有一点机制说明一下,几个等级,就相当于在划分阈值,比如把E等全部认为是阳性,lift curve同理,lift的意义在于用了模型后比没用模型提升了多少,然后lift curve也是个累计的,横轴称为depth,纵轴就是lift,但是lift curve的问题在于,depth为0的点,我并不知道怎么画?因为这个时候的pctbad为0/0,应该是没法画的,但是我不知道别人是如何表达这个点的,先把问题留在这里!