IJCAI-18 阿里妈妈搜索广告转化预测总结(0.13966,53/5204)
赛题内容
本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad, context, shop)。
结合淘宝平台的业务场景和不同的流量特点,我们定义了以下两类挑战:
- 日常的转化率预估
- 特殊日期的转化率预估
评估指标
数据挖掘流程
- 数据探索与特征使用方案:业务逻辑和特征覆盖率
- 数据采样:样本采样与过滤
- 根据特征使用方案构造特征:基础特征、平稳特征、动态特征、高阶特征、文本特征、偏好特征、趋势特征、leak特征等
- 特征分类:连续性、二值型、枚举型
- 特征处理与分析:特征归一化、离散化(one-hot)、缺失值填补
- 特征选择:过滤型、包裹型(采用该方案,KFlodÿ