创意火花-聚类算法

#聚类算法
以前在考虑机器学习的应用场景时,都是按照端到端的思路,比如,客户流失分析,输入客户列表及相关特征,输出流失的名单。之前也尝试过利用逻辑回归、决策树等算法对客户流失进行预测,效果不是特别好,里面既有数据不全面的问题,同时也应该存在算法单一的问题。最近又学习了几个常用机器学习算法,包括支持向量机、逻辑回归、聚类算法等,虽然还是没有理解了算法的基本原理,还是不会调参,但仍然有了一点收获,机器学习算法可以和人工分析结合起来使用,并不是一定要完整解决一个问题才能用机器学习
基于上面的想法,把机器学习的聚类算法应用到了业务稽核场景。业务稽核的实质是发现异常业务,以大额预存为例,人工分析的时候,一般是先设定一个大额的标准,比如,最高节目包是20美元,那么就设定高于20美元的预存,找出预存高于20美元的客户,分析其所订购的节目包、历史充值的习惯等。在这个过程中,20美元的设定是一个关键,需要分析人员可以根据项目国的政策、历史缴费习惯、当前促销政策等综合分析事设定。为了找到合理的阈值,降低后续分析的工作量,可以引入“聚类分析”算法,由聚类算法根据所有充值客户的充值金额、订购节目包、缴费习惯等,把所有的缴费用户聚类成几个类。一般来讲,分类内的用户越多,出现异常业务的可能性也越低(即使有异常,也很难发现)。分析人员只需要关注离群点的用户以及分类内用户较少的类,通过查看这些用户的相关信息,综合判断是否为异常业务。在这个过程中,

  • 聚类算法虽然不能直接分析出异常业务,但可以根据业务特征把数据分成几个类
  • 分析人员通过解读算法给出的分类,抽查分析明细数据,综合判断出异常业务

下图是使用了聚类算法的业务稽核原型,供参考:
智能业务稽核原型

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值