【notebook】notebook list

rejudge

已于 2023-07-05 17:41:16 修改

阅读量509

点赞数

分类专栏： notebook 文章标签：机器学习 python sklearn

于 2023-05-16 16:07:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45249685/article/details/130706942

版权

notebook 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

kaggle notebooks

1. 【notebook】xgboost-lightgbm-catboost 预测取平均
2. 【notebook】xgboost, cudf, Regression Class Cutoff(连续值转类别整数划分最佳阈值)

1. 【notebook】xgboost-lightgbm-catboost 预测取平均

【notebook】xgboost-lightgbm-catboost 预测取平均

xgboost + lightbgm + catboost 利用 np.column_stack 组合预测结果取平均；
简单的特征筛选：去除只有一个值的特征；
ordinal/label encoder：特征数/行数太大，独热编码会增加比率引起过拟合，不采用；
最终决胜点在于Adding Risk Factors ：https://www.kaggle.com/c/playground-series-s3e3/discussion/380920
MultiColumnLabelEncoder ：
https://www.kaggle.com/code/radek1/eda-training-a-1st-model-submission
【Python】特征编码 - 多标签特征同时编码(封装类方式)

2. 【notebook】xgboost, cudf, Regression Class Cutoff(连续值转类别整数划分最佳阈值)

【notebook】xgboost, cudf, Regression Class Cutoff(连续值转类别整数划分最佳阈值)

xgboost 但模型，optuna提前调优；
Regression Class Cutoff：将分类转变为回归来做，最终预测的回归值按照设置的分割阈值转成类别整数，需要找到最佳的分割阈值，涉及到scipy.optimize.minimize来搜索最佳阈值；
【Python】特征编码 - Regression Class Cutoff(连续值转整数寻找最佳划分阈值)
【Scipy】scipy.optimize.minimize
Kappa相关性系数的概念和代码；
【sklearn】sklearn.metrics - sklearn.metrics.cohen_kappa_score
交叉验证的一个用法 >>> 求解最终预测值
详见notebook中cross_valid函数
(1) 找到最优模型(参数)后，将参数固定，生成的模型在训练集上进行交叉验证；
(2) 每轮循环在不同折的训练集上训练得到不同模型，每轮生成的模型在整个测试集上进行预测，生成概论模型的预测值；
(3) 最终所有轮模型的预测结果的平均值。
cudf是一个 GPU DataFrame库，pandas只能在cpu上运行，cudf将dataframe转到gpu上；详见notebook中cross_valid函数；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

rejudge CSDN认证博客专家 CSDN认证企业博客

码龄5年

96: 原创

2万+: 周排名

2万+: 总排名

8万+: 访问

: 等级

1302: 积分

3648: 粉丝

129: 获赞

13: 评论

337: 收藏

私信

关注

热门文章

分类专栏

刷题 5篇
C++ 17篇
Linux 13篇
Python 43篇
notebook 1篇
算法积累 10篇
Java 3篇

最新评论

【Pytorch】Transformer encoder代码实现
猪猪侠MAX: pytorch里面transformer.encoder默认的输入shape是[bs, dim, length]，后面两个维度和大佬您这个是相反的吗
【Pytorch】Transformer encoder代码实现
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【Python】贝叶斯超参数优化
m0_75114620: 博主贝叶斯可以去优化像粒子群算法的参数吗得到最优参数组合
【Python】基础运用
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 如何入门Python: https://activity.csdn.net/creatActivity?id=10436?utm_source=csdn_ai_ada_redpacket 程序员的你，有哪些炫技的代码写法？: https://activity.csdn.net/creatActivity?id=10438?utm_source=csdn_ai_ada_redpacket 全国科技者工作日—为创新和未来而努力: https://activity.csdn.net/creatActivity?id=10443?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
【Python】对抗验证
愚夫、: hello 请问最后得到的feats是什么呀

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。