2021腾讯算法大赛
目的:探索副业,也是通过实践了解算法行业。
路径:学习既往案例,打造本次传奇。
学习(一)
赛题介绍:
已知历史点击记录,求点击人属性。
- 数据:训练集,测试数据集,二者不同在于后者无年龄和性别信息。
- 目标:求出测试数据集的年龄和性别。
- 评价指标:对年龄和性别分别评估准确率,再求和。
特征工程(找特征):
- 统计特征:
- 用户出现的总次数和天数
- 用户点击广告的总次数
- 用户点击不同广告、产品、类别、素材、广告主的总数
- 用户每天每条广告点击的平均次数,均值和方差
- 概率分布特征
问题点:五折交叉、target encoding
参考资料:2020年腾讯算法大赛——冠军分享