- 博客(3)
- 收藏
- 关注
原创 使用逻辑回归对信用卡诈骗分析
此次的数据集包括了 2013 年 9 月份两天时间内的信用卡交易数据,284807 笔交易中,一共有 492 笔 是欺诈行为。输入数据一共包括了 28 个特征 V1,V2,……V28 对应的取值,以及交易时间 Time 和交易金额 Amount。为了保护数据隐私,我们不知道 V1 到 V28 这些特征代表的具体含 义,只知道这 28 个特征值是通过 PCA 变换得到的结果。另外字段 Class 代...
2020-02-29 18:26:35 606
原创 SVM对乳腺癌的检测
数据集来自美国威 斯康星州的乳腺癌诊断数据集,数据表一共包括了 32 个字段,代表的含义如下: 上面的表格中,mean 代表平均值,se 代表标准差,worst 代表大值(3 个大值的平 均值)。得出了这 30 个特征值(不包括 ID 字段和分类标 识结果字段 diagnosis),实际上是 10 个特征值(radius、texture、perimeter、area、 smoothness、co...
2020-02-28 18:22:59 1361
原创 使用机器学习配合管道机制对信用卡违约建模
数据集解读 这是某个银行的违约数据集 数据探索 首先我们导入建模需要用到的库 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt import warnings from sklearn.preprocessing import StandardScaler from sklearn.pipeline...
2020-02-25 16:00:49 573
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人