特征
leeshutao
这个作者很懒,什么都没留下…
展开
-
【特征】特征选择(1)
sklearn -- 1.13. 特征选择(Feature selection)简书 -- scikit-learn--Feature selection(特征选择)1 移除低方差的特征假设有一个带有布尔特征的数据集,要移除那些超过80%的数据都为1或0的特征。布尔特征是伯努利随机变量,该类变量的方差为:可以使用阈值.8*(1-.8)。推测这里应该不限制于伯努利分布。............原创 2019-07-02 22:21:21 · 195 阅读 · 0 评论 -
【特征】PSI的计算
PSI:检验变量的稳定性,当一个变量的psi值大于0.0001时,变量不稳定。一个变量,将它的取值按照分位数来分组一下,每一组中测试模型的客户数占比减去训练模型中的客户数占比再乘以这两者相除的对数,就是这一组的稳定性系数psi,然后变量的psi系数就是把这个变量的所有组的psi相加总起来。计算某个变量的PSI,上面这段话中测试模型和训练模型替换成两个月份即可。例如,下表是某个变量,以201.........原创 2019-01-30 18:11:56 · 29030 阅读 · 3 评论