需求:统计出一天的用户中,登录1次的用户56422次,登录2次的49422,一直到登录N次的,用户为1个末尾,大多数用户都是正常用户,只会登录最多几十次,现在需要规定阈值设定就是有0.05%的坏人比例,根据该比例来划分登录异常次数的阈值。即按照登录次数升序,用户数量达到99.95%的列作为判定坏人的阈值
数据样例(含实现数据)
time | login_cnt | user_cnt | user_cnt_add | percenter |
---|---|---|---|---|
190315 | 1 | 56422 | 56422 | 56422/sum |
190315 | 2 | 49422 | 105844 | 105844/sum |
190315 | 3 | 36422 | 142266 | 142266/sum |
190315 | 4 | 20000 | 162266 | 162266/sum |
…… | …… | …… | …… | …… |
190315 | 200 | 20 | 300020 | 300020/sum |
…… | …… | …… | …… | …… |
190315 | 400 | 2 | 301022 | 301022/sum |