先说结论
线上 AUC:0.7466
这是我正儿八经参加的第一个数据科学竞赛,心路历程也是十分艰辛,队友经历几次更换,自己也是经常游走在崩溃的边缘,同门都说我头发又见秃,总之不是很顺利的,最后结果不是很理想。用我队友的话就是100来人的比赛,不拿个top3真的没用。
菜是原罪。?
这个比赛总结,拖了太久了,自己真的是拖延癌晚期,写出来对别人实际参考意义不大,只是对我自己的一个总结,想在这个基础上把代码整理一下,争取下次别这么丢人了~
百度点石
先来谈谈百度点石吧,常见的比赛阵地是天池、kaggle、datacastle等等,点石算是比较小众的吧,含金量不高,参赛人数较少,倒是之前因为他和我交合作了一个比赛有点印象。
再也不想参加点石的比赛了,有问题官方不管不顾,题目不规范,对新手最终要的论坛也存在活跃度几乎为0的情况,体验感超差,太不友好了,费心费神。如果你和我一样还是入门新手的话,建议还是平台大一些的天池或者kaggle吧,和一些热爱分享的人一起比赛,进步会很快的~
一次管够,再也不想参加了。
赛题背景
学计算机还是需要点英文阅读能力的~
如果你读着很累,还是选择有道滑词翻译插件吧~
大概就是:根据用户基本属性、视频信息与用户行为信息,预测用户是否留存。
是一个二分类问题,评价指标是AUC。
数据探索
获取数据
数据呈现的特点是:真实脱敏数据,数据庞大,缺失