判别欺诈交易与正常交易的方法
电子商务的飞速发展,第三方支付平台欺诈风险呈现递增趋势,可以判别第三方支付平台欺诈交易和正常交易的方法有哪些?
按是否存在目标变量分
分为有监督和无监督
1、是否需要欺诈交易的数据?多还是少?
若需要,数据会很少,有监督;不需要,通过判断刷卡的时间、地点、商户名称、金额、频率等数据进行判断,无监督。
2、采集数据会出现的问题?
采集有欺诈行为的数据,很少,也可能没有,从而导致样本不随机。
存在目标变量(y):有监督
需要采集欺诈交易与正常交易行为的数据:
1、Logistic回归。
2、判别分析
3、BP神经网络
4、决策树
5、支持向量机(SVM)
6、贝叶斯网络
不存在目标变量:无监督
最关键的步骤:构造新属性。采用分类模型,通过已有的数据构造新的属性,即:把属性生成出来,创建标签是否存在欺诈交易行为。数据量越多,模型越好,即把所有的数据采集过来,离群点可能是有欺诈交易。
1、 系统聚类(5种)
最长距离法、中间距离法、两种类平均法(类之间的距离为均方距离,类之间的距离为平均距离)离差平方和法
2、 K均值聚类
3、 密度聚类