实现快速调参和参数可视化,喝杯茶

大家好,我是Toby,今天上午完成快速调参和参数可视化。在机器学习建模中,特别是模型竞赛,调参是个脏活。

调参也叫超参,英文术语为hpyterparameter。举个简单例子方便大家理解什么是调参。我们把车辆看成一个模型,我们在驾驶车辆时会面临几个重要参数:

驾驶速度

温度

音乐

其它参数

驾驶速度是最重要参数。高速路,乡村路,城市路的限速是不一样的,你在高速路上可以把驾驶速度调高一些,例如90km/h,但在城市路上不允许开这么快,需要调低点,例如60km/h。

温度也是重要参数,夏天车内太热,需要开空调降低车内温度。冬天太冷,需要调高车内温度。

音乐是不痛不痒参数,有的车主喜欢边开车边听音乐,有的车主不喜欢边开车边听音乐。喜欢开车听音乐的有的喜欢爵士音乐,有的喜欢重金属音乐,有的喜欢轻音乐。不同车主爱好也让音乐参数范围较广。

如何让车辆(理解为模型)达到一个最佳行驶状态?车主需要让驾驶速度,温度,音乐达到一个最佳组合,例如安全驾驶速度,合适温度,愉悦音乐。

作者不想高谈大论数学公式,面对大众读者,只想把复杂问题简单化,方便大家理解。机器学习模型只是把现实中模型抽象化,模型来源于生活,抽象于生活。机器学习模型可应用于各行各业,并非计算机专业的专利,文科生,理科生,工科生,小学生,中学生,大学生都可以学习,不分高低贵贱。越早接触机器学习,大脑思维能力和智力水平提高越大。

之前模型竞赛中,作者对调参充满痛苦回忆。电脑硬盘不停旋转,时间一天一天耗去。今天终于搞定快速调参,测试数据用的风控模型German credit德国信用数据集。下图有关于German credit案例的python代码复现,有兴趣同学可以去了解《python信用评分卡建模(附代码)》

通过多次调参实验,给大家的通用经验是贝叶斯+GPU+lightgbm+并行,调参速度可以快速缩短。下图是今早调参的记录,一共有50次实验,第33次实验为最佳,AUC值为0.8122。

用了贝叶斯,每次运行脚本会有不同结果,这是随机带来结果,很好理解。

如果数据量大,参数多,建议大家不要用gridsearch网格调参,这会非常耗时。

调参记录,显示从0-50次实验的最佳AUC值

参数重要性hpyterparameter importance,显示参数重要性排序。下图显示min_child_samples是最重要参数,min_child_samples表示叶节点样本的最少数量,默认值20,用于防止过拟合。

浏览器可以展示超参详细可视化数据

parellel coordinate

最终结果来看German credit德国信用数据集的catboost超参后,AUC最高,但训练模型非常耗时。lightgbm性价比很高,训练大规模数据的速度非常快,调参也快。lightgbm可用于快速测试算法。

快速调参和参数可视化就为大家介绍到这里,如果大家对消费金融的风控模型技术感兴趣,欢迎了解系列课《python金融风控评分卡模型和数据分析微专业课(加强版)》

论文复现机器学习模型案例大本营(收藏)

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python机器学习建模

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值