1、今天他妈的上午又干了一些没用的事情,去给运营进行一些解释,但是也发现自身模型数据存储的必要性,这个也是急切地打对方脸,现在事情这么多其实没必要这么急切打别人脸,考虑好优先级
2、下午就是决策引擎调整的事情
3、剩余的时间又开始建模,这次我是很正式的筛选出了模型变量,为了考虑所选自变量的稳定性,我在6个不同的因变量上计算平均iv,筛选出大于0.03的,在时间维度上,我用了我建模正式定义的真正y变量在三个时间段上,加上全样本计算平均iv,取大于0.03的,和前面的不同定义下的集合做交集,然后考虑单调性、相关性和业务因素,最后得到8个变量,都是些体力活没什么新东西,需要完善的就是自己的工具包,对于regroup还是不够智能和随心所欲,需要构架一下