task1打卡
目标:竞赛理解+baseline跑通
完成情况:
使用了天池自带的训练环境,跑了一遍baseline,需要再回顾第一期的推荐知识,有些代码的计算公式原理还没有很明白
task2打卡
目标:数据分析
完成情况:
看了学习手册,没有跑代码。希望在后续的学习中多写一些学习笔记
task3 特征工程
观看了天池的直播
-
召回后需要对数据进行负采样
去除了一些0,但是要保证用户和物品种类不减少
-
训练集和测试集的用户不能有交叉
特征构造的三种思路
基于用户的特征行为
基于日志构造用户的特点、文章的特点
特征没有做相对位置信息