移动支付在我们日常生活中已经从一种时尚慢慢变为支付交易的首选,然而这也给资金安全带来了一定风险,不法分子正利用各种手段进行诈骗。所以可疑交易侦测变得非常关键。
在这个例子中,我们将引导你使用R2 Learn一步步建立机器学习模型,进行移动支付领域欺诈行为的识别。
1. 数据集介绍
我们使用的数据集来自kaggle,大小为470M,6,362,620个样本和11个变量(含响应变量)。所包含的变量,类型和描述参见图1.1。我们将抽样100w行来完成模型的学习。
图1.1 变量描述
在本例中,我们收集到的变量包括移动货币交易发生的时间,交易双方的ID和金额,交易类型等信息,以及该次交易是否属于可疑交易。
2. 新建机器学习项目
我们的目标是判断某笔交易是否可疑,因为响应变量“isFraud”取值为0或者1,其中1代表可疑交易,0代表正常交易,所以要建立的是分类模型。
图2.1 选择问题类型
点击“Files”导入用与建模的数据文件“paysim_sample.csv”。我们还提供数据库导入功能(点击图2.2中的”SQL”按钮)。