2021腾讯算法大赛

这篇博客介绍了参与2021腾讯算法大赛的经历,旨在通过实践了解算法行业。赛题是根据历史点击记录预测用户年龄和性别,数据包含训练集和测试集,评价指标为年龄和性别准确率之和。特征工程中涉及统计特征和概率分布特征的构建,如用户行为频次、点击分布等。作者提到五折交叉验证和target encoding作为解决难点的方法。参考了2020年冠军策略来提升解决方案。
摘要由CSDN通过智能技术生成

2021腾讯算法大赛

目的:探索副业,也是通过实践了解算法行业。

路径:学习既往案例,打造本次传奇。

学习(一)

赛题介绍:

已知历史点击记录,求点击人属性。

  1. 数据:训练集,测试数据集,二者不同在于后者无年龄和性别信息。
  2. 目标:求出测试数据集的年龄和性别。
  3. 评价指标:对年龄和性别分别评估准确率,再求和。

特征工程(找特征):

  1. 统计特征:
  • 用户出现的总次数和天数
  • 用户点击广告的总次数
  • 用户点击不同广告、产品、类别、素材、广告主的总数
  • 用户每天每条广告点击的平均次数,均值和方差
  1. 概率分布特征

问题点:五折交叉、target encoding

 

 

参考资料:2020年腾讯算法大赛——冠军分享

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值