案例背景:
有些人利用信用卡进行诈骗活动,如何根据用户的行为,来判断该用户的信用卡账单是否属于欺诈呢?想获取数据集请点此处。在这个数据集中,由于原始的用户数据具有一定的隐私,因此,每一列(即特征)的名称并没有给出,而是使用V1,V2等代替。目标是进行异常值的检测。数据集中有一列值class,要么为0,表示正常,要么为1,表示异常。
案例实战:
第一步:首先导入数据分析所需用的第三方库numpy、pandas,以及可视化库matplotlib
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 将matplotlib的图表直接嵌入到Notebook之中,inline表示将图表嵌入到Notebook中
%matplotlib inline
第二步:读取数据,以及基本信息
data = pd.read_csv("creditcard.csv")
data.info()
data.head()
运行结果: