![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘模型
小浣熊1016
这个作者很懒,什么都没留下…
展开
-
数据挖掘模型中的IV和WOE详解
转:https://blog.csdn.net/kevin7658/article/details/507803911.IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用...转载 2018-12-10 16:31:57 · 191 阅读 · 0 评论 -
机器学习 评分卡
转:https://blog.csdn.net/weixin_41363820/article/details/78834012 机器学习简介什么是机器学习如果一个系统能够通过执行某个过程改变它的性能,这就是学习(什么是学习)不用编程去指定机器做什么,而是让机器有能力自己学习首先定义任务T,经验E,表现P,如果机器有一个任务T,随着经验E的增多,表现P也会变好,则表示机器正在经验E中学...转载 2018-12-10 18:05:55 · 757 阅读 · 0 评论 -
数据处理方向
1.目标和目的清晰明确数据处理的目的和目标,而后才有针对目的和目标的方法和路径。2.设计正确的处理方案,方案需要考虑以下问题:(1)正确性:数据执行结果准确无误,需要做case检查和统计检查;(2)稳定性和鲁棒性:数据能够稳定的执行,处理过程需要考虑完整的异常处理机制和措施;(3)可运营数据处理过程能够监控到处理的过程和阶段性结果;(4)可快速恢复或重构出现...转载 2019-02-22 10:34:17 · 416 阅读 · 0 评论 -
模型常见问题排查
模型问题排查问题关键2个环节:环节1:因子分布异常缺失率异常 均值异常 极值异常 方差异常 因子时间趋势性变化出现以上现象需要进行2个分析:成因分析和影响分析,完毕之后再形成解决方案。 环节2:模型输出 PSI异常:PSI公式参考:https://www.zhihu.com/question/24490261/answer/229524690(1) 均匀尺度评分表...转载 2019-02-22 10:36:55 · 963 阅读 · 0 评论 -
lgbm模型使用问题
使用lgbm模型中,遇到过几个问题:1.Estimator not fitted, call `fit` before exploiting the model. 训练模型时,创建了多个estimator(参数合集),最终生成pkl文件时,参数版本紊乱。2.No module named 'pandas.core.indexes 训练模型和模型部署运行的环境不一致,py...原创 2019-07-16 10:49:18 · 3426 阅读 · 3 评论 -
Centos切换图形界面
要进入图形界面,首先要安装。所以应该先执行yum groupinstall "X Window System" -yyum groupinstall "Desktop" -y接着,敲命令:startx 或 init 5原创 2019-09-24 17:59:55 · 163 阅读 · 0 评论