第38期Datawhale组队学习——零基础入门数据挖掘赛事

前言

Datawhale第38期组队学习来了!这次选择的是Datawhale开源学习项目——“零基础入门数据挖掘赛事”,赛题【电信客户流失预测挑战赛】详情见链接🔗,学习周期为6.13-6.22,在此记录初次接触数据挖掘赛事的小白学习历程。这次学习没有直接教程,而是提供了一个Baseline🔗用于预热学习!另外,去年二手车的案例,比赛步骤都一样,只是比赛数据特点不一样!可以参考学习!详情见链接🔗

学习路线

Task01:赛事全流程实践(6.13-6.16)

具体要求:
报名赛事实践,并下载数据集;
理解实践场景,梳理解题思路;
按照给定的基线解决方案跑通代码;
提交相应的结果文件。

1、二手车交易价格预测赛题——链接🔗
Datawhale学习教程:链接🔗
Baseline:链接🔗
评分标准:MAE
视频讲解:链接🔗
Task1 赛题理解+视频录播01:Baseline + 赛题理解
Task2 数据分析
Task3 特征工程+视频录播02:特征工程
Task4 建模调参+视频录播03:建模和调参
Task5 模型融合+视频录播04:模型融合

2、电信客户流失预测赛题——链接🔗
Baseline:链接🔗
记录:新增加catboost、gensim、tqdm模块库
评分标准:AUC
Baseline-lgb成绩:0.83909
Baseline-xgb成绩:0.8065(耗时最长)
Baseline-cat成绩:0.79662(耗时最短)

3、糖尿病遗传风险检测挑战赛——链接🔗
Baseline:链接🔗
Baseline-lgb成绩:0.96716

Task02:赛事上分攻略(6.17-6.22)

具体要求:
学习数据挖掘场景下,赛事上分的常见思路;
根据所学理论知识,能应用实践到本次实践中,提交上分分数打榜。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值