【金融风控建模系列】特征篇（一）

从那开始

已于 2024-04-01 17:06:57 修改

阅读量1.1k

点赞数 17

分类专栏：金融风控建模系列内容文章标签：深度学习人工智能 python pycharm mysql 决策树

于 2024-03-21 11:36:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ANoway/article/details/136836564

版权

金融风控建模系列内容专栏收录该内容

5 篇文章 1 订阅

订阅专栏

第三章特征

文章目录

第三章特征
前言
一、建模前
- 1.toad库特征筛选
- 2.结果分析
二、建模后
总结

前言

数据篇中提到了多种处理数据的方法，包括数据抽取，单客群处理和多客群处理。经过上述步骤后，模型已初具雏形。
进入特征篇后，数据样本基本不会再发生改变，模型将在不断调试特征的情况下取得表现更好的模型。评估的标准是现有模型相比于其他模型在各个客群上表现的增益。
特征筛选按照处理时间段分为建模前和建模后。建模前的目的是特征初筛，建模后的目的是剔除干扰特征。

一、建模前

1.toad库特征筛选

toad是风控建模中常用的包。它可以在筛选特征中起到关键作用。
其中，关键包和函数如下：
import toad
toad.selection.select()

特征筛选的主要参数如下：
empty_limit
iv_limit
corr_limit

为选取最合适的特征，这里采用“控制变量的方式”选择最优参数。具体操作步骤如下：

1.每轮选定一个待调整参数，其余为固定参数。
2.第一轮的固定参数按照各自范围内最常见的值进行确定。
3.每轮确定一个待调整参数，并在下一轮中把该参数设定为固定参数。
4.确定所有最合理的参数。

2.结果分析

在这里插入图片描述

这是结果记录表，红框内展示的是其中一轮的结果。从表中可以看到，empty_limit是待调整参数，train_size,iv,corr为固定参数。

在这里插入图片描述
选择相同属性集进行比较，选出KS/AUC综合表现更好的参数用于之后做固定参数。经过数轮的筛选，选出最适合当前样本的初筛特征。
结合已挑选的样本和初筛特征，进入模型训练环节。

二、建模后

根据模型在各个客群上的表现，选出表现不佳的客群。

总结

以上就是数据章节的第三部分，本部分介绍了多客群样本的生成过程，包括核心单客群的选择和样本叠加。
下篇文章会进入系列文章的特征篇，这个章节会阐述如何选择最适合样本的特征，从而进一步提升模型在各个客群的表现。
代码问题或其他任何问题想要咨询的小伙伴可以加作者微信：HopesXj
咱们下次见。

关注

17
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

从那开始 CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

128万+: 周排名

14万+: 总排名

7801: 访问

: 等级

301: 积分

265: 粉丝

92: 获赞

8: 评论

91: 收藏

私信

关注

热门文章

分类专栏

金融风控建模系列内容 5篇

最新评论

【华为OD机试 Python】递归问题之考古学家
飞鸟_道一: [code=java] / 翻译一份java 语言版本 private static List<String> res = new ArrayList<>(); public static void main(String[] args) { int n = 3; String str = "abc"; combine(str, ""); Set<String> strings = new LinkedHashSet<>(res); System.out.println(strings); } public static void combine(String str, String cur) { if (str.length() == 0) { res.add(cur); return; } else { int len = str.length(); for (int i = 0; i < len; i++) { String a = str.charAt(i) + ""; String b = str.substring(0, i) + str.substring(i + 1); combine(b, cur + a); } return; } } [/code]
【华为OD机试Python】双指针问题之最多可以派出多少支团队
CSDN-Ada助手: 恭喜你完成了第12篇博客！你的标题很吸引人，我对双指针问题也很感兴趣。你在博客中的解析是否能够帮助读者更好地理解这个问题呢？或许你可以尝试给出一些实际案例或者应用场景，以便读者更好地应用这个技巧。感谢你的付出，并期待你的下一篇博客！
【华为OD机试Python】广度优先问题之宜居星球改造计划
CSDN-Ada助手: 恭喜您写了第13篇博客！标题《【华为OD机试Python】广度优先问题之宜居星球改造计划》非常吸引人。从标题来看，您似乎深入研究了广度优先问题，并且能够将其应用于宜居星球改造计划中，这真是令人赞叹！我想给您一个创作建议，希望我不会显得过于自负。既然您已经掌握了广度优先问题，下一步或许可以考虑深度优先问题，探索其在宜居星球改造计划中的应用。这样，您的博客将更加全面且有深度，给读者带来更多启发。再次恭喜您的持续创作，期待您的下一篇博客！
【华为OD机试Python】广度优先遍历之树状结构查询
CSDN-Ada助手: 恭喜您写了第14篇博客！标题看起来非常有趣，我很期待阅读关于广度优先遍历和树状结构查询的内容。您的持续创作真的很令人钦佩！不过，如果可能的话，我希望您能在下一篇博客中分享一些关于深度优先遍历的知识，因为我对这个主题也很感兴趣。感谢您的努力和分享！
【华为OD机试 Python】递归问题之分糖果
从那开始: 这题作者认为已为最佳解法。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

从那开始 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。