论文 | Credit Card Fraud Detection Using Convolutional Neural Networks

本篇博客继续为大家介绍一篇论文,也是关于用卷积神经网络 CNN 来进行信用卡欺诈检测的。

论文信息

论文题目:Credit card fraud detection using convolutional neural networks

作者姓名:Fu K, Cheng D, Tu Y, et al.

会议期刊:International Conference on Neural Information Processing

发表时间:2016

关键词

信用卡欺诈 卷积神经网络 数据不平衡

一、四个问题

1. 文章解决了什么问题?

检测信用卡欺诈。

2. 用什么方法解决?

基于卷积神经网络CNN的框架

3. 有什么效果?

用F1score评估模型的表现,结果优于SVM、 RF、 NN等方法。

4. 存在什么问题?

作者没有提到。

存在的疑惑有:CNN的方法虽然优于SVM等,但是不是最好的?是不是有更好的,但是没有被提及。

二、文章内容

1. Introduction

机器学习的很多方法被可以用来解决信用卡欺诈问题,比如决策树,boolean logic 函数等。但由于一些欺诈交易和合法交易类似,采用传统的机器学习方法有时候不能发现这些欺诈类型的交易。也有采用神经网络或者贝叶斯的方法,但被批评太复杂或过拟合。采用CNN的方法可以发现欺诈交易潜在模式,避免过拟合,降低特征冗余。

特征生成是机器学习的一大挑战,一些研究采用集成方法获得客户消费模型,但不能描述复杂模式。本文基于客户的交易偏好,提出交易熵的方法。将交易数据转换为特征矩阵,按照内在联系和时间序列,用于CNN模型。

用基于成本的抽样方法,从真实欺诈的数据来合成欺诈样本,解决数据不平衡的问题。

2. Methodology

2.1 欺诈检测框架

1
如图所示,欺诈检测框架由训练和预测两部分组成。

训练部分主要包括四个模块:特征工程(feature engineering),采用方法(sampling methods),特征转换(feature transformation)和基于 CNN 的训练过程(a CNN-based training procedure)。

检测过程包括特征提取(feature extraction),特征转换(feature transformation)和分类模块(classification module)。

2.2 特征工程

2Table 1 描述了不同特征类型,前7个是传统的特征,最后一个特征是本文提出的新特征。

提出来的新的特征叫交易熵(trading entropy)。假定在当前交易之前,同一个客户在过去的一段时间的所有交易里,有 K 种不同类型的交易,所有的交易总量为 T o t a l A m o u n t T TotalAmountT TotalAmountT, 第 i i i 种交易的总量为 A m o u n t T i , ( i = 1 , 2 , . . . , K ) AmountT_i, (i = 1, 2, ...,K) AmountTi,(i=1,2,...,K),那么第 i i i种交易类型的占比 p i p_i pi为:
p i = A m o u n t T i T o t a l A m o u n t T p_i = \frac{AmountT_i}{TotalAmountT} pi=TotalAmountTAmountTi
i i i 种类型的交易可以被定义为 E n t T EntT

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
IEEE-CIS Fraud Detection is a Kaggle competition that challenges participants to detect fraudulent transactions using machine learning techniques. KNN (k-Nearest Neighbors) is one of the machine learning algorithms that can be used to solve this problem. KNN is a non-parametric algorithm that classifies new data points based on the majority class of their k-nearest neighbors in the training data. In the context of fraud detection, KNN can be used to classify transactions as either fraudulent or not based on the similarity of their features to those in the training data. To implement KNN for fraud detection, one can follow the following steps: 1. Preprocess the data: This involves cleaning and transforming the data into a format that the algorithm can work with. 2. Split the data: Split the data into training and testing sets. The training data is used to train the KNN model, and the testing data is used to evaluate its performance. 3. Choose the value of k: This is the number of neighbors to consider when classifying a new data point. The optimal value of k can be determined using cross-validation. 4. Train the model: Train the KNN model on the training data. 5. Test the model: Test the performance of the model on the testing data. 6. Tune the model: Fine-tune the model by changing the hyperparameters such as the distance metric used or the weighting function. Overall, KNN can be a useful algorithm for fraud detection, but its performance depends heavily on the quality of the data and the choice of hyperparameters.
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值