赛题简介
这个比赛是新闻推荐场景下的用户行为预测挑战赛,以新闻APP中的新闻推荐为背景,目的是要求我们根据用户历史浏览点击新闻文章的数据信息来预测用户未来的点击行为,即用户的最后一次点击的新闻文章。
数据概况
赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。
数据表
train_click_log.csv
:训练集用户点击日志
testA_click_log.csv
:测试集用户点击日志
articles.csv
:新闻文章信息数据表
articles_emb.csv
:新闻文章embedding向量表示
sample_submit.csv
:提交样例文件
字段表
Field | Description |
---|---|
user_id | 用户id |
Field | Description |
user_id | 用户id |
click_article_id | <