2.信用卡欺诈案例——19.10.7

最新推荐文章于 2024-08-25 10:42:58 发布

Edward_is_1ncredible

最新推荐文章于 2024-08-25 10:42:58 发布

阅读量442

点赞数 1

分类专栏：案例整理文章标签：机器学习逻辑回归

本文链接：https://blog.csdn.net/Edward_is_1ncredible/article/details/102021905

版权

本文探讨了在数据集极度不平衡的情况下，如何利用下采样和逻辑回归进行信用卡欺诈检测。主要涉及下采样方法、交叉验证、正则化惩罚系数调整、阈值设定对分类的影响，以及精度和召回率的权衡。同时对比了过采样与下采样在处理不平衡数据集时的效果，强调过采样在本案例中可能更为适用。

摘要由CSDN通过智能技术生成

该案例的主要知识点：

1.对于数据集标签分布不均衡条件下的分类方法（下采样，上采样及两者的差异）

2.逻辑回归模型的实施（交叉验证，正则化惩罚系数c，判定阈值的设定）

3.简单的数据预处理（标准化）

4.精度，召回率以及混淆矩阵的概念

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")

data = pd.read_csv(r"C:\Users\Administrator\01_machinelearning\1-2\creditcard.csv")
data.head(3)

Time	V1	V2	V3	V4	V5	V6	V7	V8	V9	...	V21	V22	V23	V24	V25	V26	V27	V28	Amount	Class
0.0	-1.359807	-0.072781	2.536347	1.378155	-0.338321	0.462388	0.239599	0.098698	0.363787	...	-0.018307	0.277838	-0.110474	0.066928	0.128539	-0.189115	0.133558	-0.021053	149.62	0
0.0	1.191857	0.266151	0.166480	0.448154	0.060018	-0.082361	-0.078803	0.085102	-0.255425	...	-0.225775	-0.638672	0.101288	-0.339846	0.167170	0.125895	-0.008983	0.014724	2.69	0
1.0	-1.358354	-1.340163	1.773209	0.379780	-0.503198	1.800499	0.791461	0.247676	-1.514654	...	0.247998	0.771679	0.909412	-0.689281	-0.327642	-0.139097	-0.055353	-0.

最低0.47元/天解锁文章

Edward_is_1ncredible

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2.信用卡欺诈案例——19.10.7

该案例的主要知识点：1.对于数据集标签分布不均衡条件下的分类方法（下采样，上采样及两者的差异）2.逻辑回归模型的实施（交叉验证，正则化惩罚系数c，判定阈值的设定）3.简单的数据预处理（标准化）4.精度，召回率以及混淆矩阵的概念import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimpor...
复制链接

扫一扫

专栏目录