天池新闻推荐入门赛之【赛题理解+Baseline】Task01

本文介绍了天池新闻推荐入门赛的赛题背景,目标是预测用户根据历史点击行为的最后一次新闻点击。数据集包含30万用户、300万次点击的交互数据,涉及新闻embedding向量。比赛要求将问题转化为监督学习的点击率预测,通过预测用户对文章的点击概率来确定最后点击的新闻。
摘要由CSDN通过智能技术生成

赛题简介

这个比赛是新闻推荐场景下的用户行为预测挑战赛,以新闻APP中的新闻推荐为背景,目的是要求我们根据用户历史浏览点击新闻文章的数据信息来预测用户未来的点击行为,即用户的最后一次点击的新闻文章。

数据概况

赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。

数据表

train_click_log.csv:训练集用户点击日志

testA_click_log.csv:测试集用户点击日志

articles.csv:新闻文章信息数据表

articles_emb.csv:新闻文章embedding向量表示

sample_submit.csv:提交样例文件

字段表

<
Field Description
user_id 用户id
Field Description
user_id 用户id
click_article_id
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值