1:引言
Hello,大家好,我是小k,一名即将大三的大数据专业的学生。接触机器学习的这一年,参加陪跑的比赛数不胜数。也从之前抱着学习的态度参赛慢慢过渡到想当前排拿证书拿奖金。
本次比赛是我参加比赛以来第一次定榜前排(今年梧桐杯是真的可惜,差一名就能去杭州公费旅游QAQ),在定榜前算是十分的紧张了,其实之前一直是top1,最后很可惜在11点左右被反超了(嘴爷还是顶的)。
看大家提交时间,得到了一个经验,定榜前一个小时最好留一两次好的机会提交...因为最后一小时真的什么都可能发生。下面,我就来简单介绍下我对该赛题具体的解题思路。
2:赛题背景
赛题链接:2022 iFLYTEK A.I.开发者大赛-讯飞开放平台 (xfyun.cn)
该赛题其实是机器学习最经典的回归问题,只要打过kaggle训练赛的朋友一定不会陌生,我去年做的第一个实战项目也是类似这个赛题。
该赛题数据由训练集和测试集组成,总数据量超过30w,包含31个特征字段(主办方都给出了解释)。20万条作为训练集,