目录:
1 简单介绍一下风控模型常用的评估指标
2 为什么ROC适合不平衡数据的评价?
3 如何处理样本不平衡的问题?
4 什么是模型的欠拟合和过拟合?
5 如何判断模型是否存在过拟合或欠拟合?对应的解决方法有哪些?
6 什么是正则化?什么是L1正则化和L2正则化?
7 正则化为什么可以防止过拟合?
8 L1和L2的区别以及分别服从什么分布
9 什么是交叉验证?交叉验证的目的是什么?有哪些优点?
10 交叉验证常用的方法有哪些?
1 简单介绍一下风控模型常用的评估指标。
混淆矩阵指标:精准率,查全率,假正率。当模型最后转化为规则时,一般用这三个指标来衡量规则的有效性。要么注重精准率,要么注重查全率,两者不可兼而得之。
ROC曲线和AUC值,ROC曲线是一种对于查全率和假正率的权衡,具体方法是在不同阈值下以查全率作为纵轴,假正率作为横轴绘制出一条曲线。曲线越靠近左上角,意味着越多的正例优先于负例,模型的整体表现也就越好。AUC是ROC曲线下面的面积,AUC可以解读为从所有正例中随机选取一个样本A,再从所有负例中随机选取一个样本B,分类器将A判为正例的概率比将B判为正例的概率大的可能性。在对角线(随机线)左边的点上TPR总大于