模型构建——使用逻辑回归构建模型，lightGBM进行特征筛选

最新推荐文章于 2024-06-02 20:35:16 发布

AIGC人工智残

最新推荐文章于 2024-06-02 20:35:16 发布

阅读量1.5k

点赞数 1

分类专栏：数据分析项目实战文章标签：逻辑回归算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gjinc/article/details/131852206

版权

本文介绍了通过逻辑回归构建模型的过程，包括实验设计、样本设计和模型训练与评估。在模型构建中，逻辑回归用于预测违约概率，并通过lightGBM进行特征筛选，以提高模型的区分度和稳定性。最终，模型在测试集上的KS和AUC表现优秀，展示了模型的排序能力。

摘要由CSDN通过智能技术生成

1、模型构建流程

1.1 实验设计

新的模型要跟原有方案对比，而且是通过实验证明，特别注意模型和策略不能同时调整。一般实验设计包含以下流程：
在这里插入图片描述

问题：业务稳定后，可以去掉人工审核吗？

答：不可以，一般模型上线后，高分段和低分段的表现较好，但中间段还是需要人工审核；而且即使模型完善后，我们只能减少人工审核，不可能完全舍弃人工审核。

1.2 样本设计

1.3 模型训练与评估

在进行模型选择与评估时，我们按照以下顺序进行模型评估：可解释性>稳定性>区分度。

区分度指标：AUC和KS
稳定性指标：PSI
AUC：ROC曲线下的面积，反映了模型输出的概率对好坏用户的排序能力，是模型区分度的平均状况。
KS：反映了好坏用户的分布的最大的差别，是模型区分度的最佳状况。

业务指标里，主要看通过率和逾期率。在合理逾期率的前提下，尽可能提高通过率。

A卡：更注重通过率，逾期率可以稍微低一些；
B卡：想办法降低逾期率，给好的用户提高额度。

2、逻辑回归模型构建

逻辑回归本质上还是一个回归问题，它的输出结果是[0,1]之间，那么这个结果可以对应到用户的违约概率上，我们可以将违约概率映射到评分上。
例如：
业内标准的评分卡换算公式 $score = 650+50log_{2}(P_{逾期}/P_{未逾期})$ ，那么这里怎么转化过去呢？我们来看以下的Sigmoid函数：
$\frac{1}{1+e^{-z}} = \frac{1}{1+e^{-(w^Tx+b)}}$
可以转化为以下公式：
$ln(\frac{y}{1-y})=w^Tx+b$

最低0.47元/天解锁文章

AIGC人工智残

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
模型构建——使用逻辑回归构建模型，lightGBM进行特征筛选

新的模型要跟原有方案对比，而且是通过实验证明，特别注意模型和策略不能同时调整。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AIGC人工智残 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。