打好天池比赛的步骤

最新推荐文章于 2024-08-09 15:30:35 发布

仓小鼠

最新推荐文章于 2024-08-09 15:30:35 发布

阅读量1.7k

收藏 26

点赞数 3

分类专栏：人工智能文章标签：自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45133592/article/details/105900267

版权

人工智能专栏收录该内容

31 篇文章 0 订阅

订阅专栏

如何在比赛中取得好成绩并成为大牛：

会基本知识
掌握学习方法
用于实践
多与人交流

参与天池比赛需要会的基础知识

xgb,lgb,catboost,numpy，matplotlib，seaborn，sklearn，keras 常用的基础数据数据挖掘常用的类（PS：sklearn可以多学一点，在无论图像还是自然处理还是数据挖掘等都需要sklearn的知识）

参见比赛的步骤

报名参赛（PS：报名时注意要求，实名认证）
下载数据集
在本地或者远端训练数据，
测试结果。

比赛的基本知识

首先在比赛时候创建一个基本的baseline然后对模型进行一步一步的改增。
对于打比赛的基本的内容包括

赛题理解：
探索性数据分析：
特征工程
模型调参
模型融合

探索性数据分析：

目的：
在这里插入图片描述 EDA的基本方法：绘图方法，量化方法：
绘图方法：（原始图像，统计图，特征模块化相同）
基本图形：
折线图：随时间变化
直方图：数据分布
密箱型图度曲线图：概率密度函数
箱型图：便于查看异常值
小提琴图：可以看出某个值分布的频率（升级版箱型图）
在这里插入图片描述

量化方法：（统计表述：偏度方差峰值，取值范围，大概分布）

相关性分析方法：
定类变量：名义变量（男女）
定序变量：不仅分类，特性排序（消费能力1-5）
定距变量：可以比较大小，差值有意义
在这里插入图片描述
第三方师傅
这里提供了一个mvtest的一个独立相关性判断的方法，可以通过下面这个github连接来学习和使用，原则作者已经将去做成了一个包使用时候可以进行调用。

特征工程：

在这里插入图片描述

建模调参

在这里插入图片描述

模型融合

在前期不要太相似，需要相似的评分，差异的结果，前期不能太相通，增加鲁棒性，模型融合基于单模型，通过融合多模型来提升结果
在这里插入图片描述

仓小鼠

关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值