- 博客(4)
- 收藏
- 关注
转载 KS值和GINI系数
KS(Kolmogorov-Smirnov):KS用于模型风险区分能力进行评估,指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。KS的计算步骤如下:计算每个评分区间的好坏账户数。计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%)。计算每个评分区间累计坏账户占比与累计好账户占比差...
2018-09-27 14:46:50 1068
原创 hive使用遇到的问题 cannot recognize input near in subquery
cannot recognize input near in subquery1、HQL子查询别名问题 备注:子查询需要加上别名 否则报错。 HQL的书写,select * from (select * from table) ; 执行此HQL,应该会报错:ql.Driver (SessionState.java:printError(960)) - FAILED:...
2018-09-07 11:49:36 69671 3
原创 limit m,n;和 limit m offset n
limit m,n;和 limit n offset m 两种方式对比只是数字换了下位置而已,实际意义相同
2018-08-29 10:31:58 1272
转载 Hivesql里的limit使用
在hive表前1000行里,过滤出不重复的refid,imsi。 错误的写法: select distinct refid,imsi from HIVE_D_MT_UU_H_SPARK limit 1000; 会去读取全表,把0~1000行的不重复refid,imsi显示出来。正确的写法: select distinct refid,imsi from (select * from H...
2018-08-29 10:27:16 36569
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人