阿里移动推荐算法比赛赛后总结--特征篇

最新推荐文章于 2021-04-21 14:26:30 发布

a1805180411

最新推荐文章于 2021-04-21 14:26:30 发布

阅读量5.2k

点赞数

分类专栏：数据挖掘机器学习

本文链接：https://blog.csdn.net/a1805180411/article/details/46993639

版权

本文详细总结了阿里移动推荐算法比赛中，特征提取的策略与方法，包括一期和二期的不同特征，如UI、U、I、C、UC特征，以及交叉特征等，并探讨了模型选择和参数设置，提供了比赛数据的背景和处理方式。

摘要由CSDN通过智能技术生成

为期100天的阿里移动推荐算法比赛终于结束了，上一篇谈了一下比赛的感受，这一篇谈谈特征的提取。该篇文章的布局：对一期和二期用到的特征分别进行说明。

在说特征的提取之前，在这里给出这个比赛的题目和数据及相关说明：

竞赛题目

在真实的业务场景下，我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中，我们不仅需要利用用户在这个商品子集上的行为数据，往往还需要利用更丰富的用户行为数据。定义如下的符号：
U——用户集合

I——商品全集

P——商品子集，P ⊆ I

D——用户对商品全集的行为数据集合

那么我们的目标是利用D来构造U中用户对P中商品的推荐模型。

数据说明

竞赛数据包含两个部分。第一部分是用户在商品全集上的移动端行为数据（D）,表名为tianchi_mobile_recommend_train_user，包含如下字段：