数据集按类划分_大数据风控面试(五) 模型评估与优化

本文介绍了风控模型的评估指标,如ROC曲线、AUC值、KS和基尼系数,强调了ROC适合不平衡数据的原因。讨论了样本不平衡问题的处理方法,包括扩大数据集、抽样和使用特定模型。同时,解释了模型的欠拟合和过拟合,提出正则化作为防止过拟合的手段,并对比了L1和L2正则化的区别。最后,讨论了交叉验证的目的、优点和常见方法。
摘要由CSDN通过智能技术生成

目录:

1 简单介绍一下风控模型常用的评估指标

2 为什么ROC适合不平衡数据的评价?

3 如何处理样本不平衡的问题?

4 什么是模型的欠拟合和过拟合?

5 如何判断模型是否存在过拟合或欠拟合?对应的解决方法有哪些?

6 什么是正则化?什么是L1正则化和L2正则化?

7 正则化为什么可以防止过拟合?

8  L1和L2的区别以及分别服从什么分布

9 什么是交叉验证?交叉验证的目的是什么?有哪些优点?

10 交叉验证常用的方法有哪些?

简单介绍一下风控模型常用的评估指标。

混淆矩阵指标:精准率,查全率,假正率。当模型最后转化为规则时,一般用这三个指标来衡量规则的有效性。要么注重精准率,要么注重查全率,两者不可兼而得之。

ROC曲线和AUC值,ROC曲线是一种对于查全率和假正率的权衡,具体方法是在不同阈值下以查全率作为纵轴,假正率作为横轴绘制出一条曲线。曲线越靠近左上角,意味着越多的正例优先于负例,模型的整体表现也就越好。AUC是ROC曲线下面的面积,AUC可以解读为从所有正例中随机选取一个样本A,再从所有负例中随机选取一个样本B,分类器将A判为正例的概率比将B判为正例的概率大的可能性。在对角线(随机线)左边的点上TPR总大于

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值