IJCAI-18 阿里妈妈搜索广告转化预测 初赛Top2%思路
赛题回顾
搜索广告的转化率,作为衡量广告转化效果的指标,从广告创意、商品品质、商店质量等多个角度综合刻画用户对广告商品的购买意向,
即广告商品被用户点击后产生购买行为的概率。
本赛题给出了某月18日到24日的数据作为训练集,并从25日的数据中(按用户?)抽取30%的数据作为A榜测试集,
70%的数据作为B榜测试集,预测某一次点击后产生购买行为的概率。损失函数使用二分类中常用的logloss。
解决方案
本次赛题提供的数据主要包括各种id类特征、用户特征、广告商品特征和店铺特征,基于CTR预估的特点,将特征工程的重心放在用户相关的特征构造上,
并且与其他统计特征相结合,对于得到的特征集合,采用wrapper方式的特征选择方法选出最优的特征子集。最后用不同的特征组训练了两个LightGBM进行模型融合。
代码为初赛方案,复赛数据量太大,跑不动。
数据划分
训练集 | 测试集 |