推荐新闻-赛题理解

1. 赛题简介

该赛题立足于真实新闻浏览数据,根据用户历史浏览记录,预测他点击的下一篇文章。

2. 数据概况

一共30用户的真实浏览数据,包括近300万次点击和36万篇不同文章。20万用户的日志为训练集,5万测试集,5万验证集。

3. 评分方式

在这里插入图片描述
赛题要求给出5篇文章作为最后的结果。如果用户最后点击的文章就是第一篇文章,那么s(user,1)=1,其他s(user,2-4)=0,那么结果是1。如果用户最后点击的文章是第二篇文章那么s(user,2)=1,其他s(user,1)=0s(user,3-4)=0,那么结果是1/2,以此类推。如果用户最后点击的文章不在给出的结果中,那么得分为0

4. 赛题理解

从36万篇文章中预测最可能点击的5篇文章可以转化为给36万篇文章出现的可能性排序,然后选出概率最大的前5篇,所以变成点击率预测的问题。考虑使用监督学习分类模型解决。

参考:零基础入门推荐系统【赛题理解+Baseline】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值