数据集按类划分_大数据风控面试（五）模型评估与优化

最新推荐文章于 2022-09-21 19:49:06 发布

火星后继者

最新推荐文章于 2022-09-21 19:49:06 发布

阅读量662

点赞数

文章标签：数据集按类划分

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_27791839/article/details/112705559

版权

本文介绍了风控模型的评估指标，如ROC曲线、AUC值、KS和基尼系数，强调了ROC适合不平衡数据的原因。讨论了样本不平衡问题的处理方法，包括扩大数据集、抽样和使用特定模型。同时，解释了模型的欠拟合和过拟合，提出正则化作为防止过拟合的手段，并对比了L1和L2正则化的区别。最后，讨论了交叉验证的目的、优点和常见方法。

摘要由CSDN通过智能技术生成

目录：

1 简单介绍一下风控模型常用的评估指标

2 为什么ROC适合不平衡数据的评价？

3 如何处理样本不平衡的问题？

4 什么是模型的欠拟合和过拟合？

5 如何判断模型是否存在过拟合或欠拟合？对应的解决方法有哪些？

6 什么是正则化？什么是L1正则化和L2正则化？

7 正则化为什么可以防止过拟合？

8 L1和L2的区别以及分别服从什么分布

9 什么是交叉验证？交叉验证的目的是什么？有哪些优点？

10 交叉验证常用的方法有哪些？

1 简单介绍一下风控模型常用的评估指标。

混淆矩阵指标：精准率，查全率，假正率。当模型最后转化为规则时，一般用这三个指标来衡量规则的有效性。要么注重精准率，要么注重查全率，两者不可兼而得之。

ROC曲线和AUC值，ROC曲线是一种对于查全率和假正率的权衡，具体方法是在不同阈值下以查全率作为纵轴，假正率作为横轴绘制出一条曲线。曲线越靠近左上角，意味着越多的正例优先于负例，模型的整体表现也就越好。AUC是ROC曲线下面的面积，AUC可以解读为从所有正例中随机选取一个样本A，再从所有负例中随机选取一个样本B，分类器将A判为正例的概率比将B判为正例的概率大的可能性。在对角线(随机线)左边的点上TPR总大于

最低0.47元/天解锁文章

火星后继者

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
数据集按类划分_大数据风控面试（五）模型评估与优化

目录：1简单介绍一下风控模型常用的评估指标2为什么ROC适合不平衡数据的评价？3 如何处理样本不平衡的问题？4 什么是模型的欠拟合和过拟合？5 如何判断模型是否存在过拟合或欠拟合？对应的解决方法有哪些？6 什么是正则化？什么是L1正则化和L2正则化？7 正则化为什么可以防止过拟合？8 L1和L2的区别以及分别服从什么分布9 什么是交叉验证？交叉验证的目的是什么？有哪些优点？10交...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。