movielens推荐系统_【专栏1】推荐系统(一)简要介绍

任少斌

什么是推荐系统

b站、快手、抖音怎么给你推荐你感兴趣的视频让你点“亿”点就是一小时?网易云、QQ音乐怎么生成你的每日推荐以及专属歌单?淘宝如何在你浏览的时候不断刺激你点开下一个商品?这些都是生活中推荐系统的应用,利用用户的偏好并进行相关推荐。

推荐系统应用的场景

· 电子商务

· 电影与视频平台

· 音乐平台

· 阅读平台

· 基于位置的服务,比如美团会申请获得用户的地址信息以方便推荐附近的酒店

· 社交网络,比如微信的视频号会在还有浏览之外出现一个红点

· 个性化广告,比如b站的主界面会推送一些个性化的广告

推荐类型

· 主页推荐
基于用户的兴趣进行推荐,每个人看到的都不同,比如淘宝的主界面、b站的主界面

· 条目推荐
在打开某个物品界面之后的推荐,比如在一本书的界面下方会推荐与之相关的书籍或者该店铺的其他书籍

推荐系统的架构

召回

根据用户的部分特征,从海量的物品库中快速找到部分用户感兴趣的物品,这是因为工业中需要在很短的时间内从亿级别单位的物品中迅速推荐一部分给用户。

排序

对于候选集,按照一定的规则进行打分排序,选取TopN进行推荐。这里候选集可能是不同来源的多个召回队列。比如矩阵分解的特征,用户的标签,社交网络推荐

20425996c8c293b5f8c4db7b417897c1.png

传统的推荐系统算法

itemCF

找到与目标用户兴趣相似的用户集合,找到这个集合中用户喜欢的且没有发生过行为的物品推荐给目标

userCF

计算物品的相似度,根据物品的相似度以及用户的历史行为生成推荐列表

隐语义模型

对于用户-物品矩阵,我们可将其分解为用户特征矩阵以及物品特征矩阵这两个维数较小的矩阵,然后根据用户的特征以及物品的特征计算用户对于物品的偏好程度进行推荐

基于图的模型

得到用户-物品的二分图,假设一个点从用户出发,那么它的轨迹就是用户-物品-用户-物品-用户-...-物品,该点最终以较高概率到达用户更偏好的物品上

数据类型

推荐系统中最重要的就是用户对于物品的行为数据,可分为显式反馈以及隐式反馈。前者包括用户对于视频的评分、购买商品、加入购物车等,后者包括用户的浏览记录等。

一条数据往往包括以下几个部分,用户ID、物品ID、行为类别,行为内容、行为权重、时间戳。行为类比如是购买、观看,行为内容比如是评论的文本,行为权重比如是浏览时长、打分分数。

常用模型评估标准

· 用户满意度 通过问卷或者在线实验获得,在电子商务中,如果用户对推荐物品产生点击行为,则表明他们是满意的

· 准确度 准确度是一个推荐算法预测用户行为的能力。因为该指标可以离线计算,方便了学者进行研究。在离线数据集中建立模型,并计算预测行为与测试集实际行为的重合度。

· 覆盖率 覆盖率描述一个推荐系统对于长尾物品的推荐能力,除了热门的物品之外,我们希望推荐系统能够推荐更多。

· 多样性 多样性描述了推荐系统对于不同兴趣领域推荐的能力,如果视频网站只推荐某一种类型的电影,用户就不会开心。

· 实时性 新闻第二天就鲜有问津,外卖新出的饭菜更值得推荐,在购买羽毛球后应该立刻给用户推荐羽毛球拍。

数据集

· https://tianchi.aliyun.com/dataset/dataDetail?dataId=46

· https://tianchi.aliyun.com/dataset/dataDetail?dataId=649

· https://grouplens.org/datasets/movielens/

前两个数据集来自阿里妈妈,类型为user ID, item ID, item's category ID, behavior type and timestamp,其中 behavior type 包括页面浏览、购买、加入购物车、对于物品的喜爱值。一共有987994个用户,4162024个物品,9439个物品类目,100,150,807条数据。

第三个来自推荐系统最经典的数据集,即Movielens。以其中1MB的ml-latest-small被广泛应用的ratings为例,包含用户ID,电影ID,用户对于电影的打分以及时间戳。

这篇只是做一个简要的介绍,在之后我会继续更新推荐系统的文章,欢迎大家来关注!!!

关于我们

Mo(网址:http://www.zhihu.com/momodel.cn) 是一个支持 Python的人工智能在线建模平台,能帮助你快速开发、训练并部署模型。

近期 Mo 也在持续进行机器学习相关的入门课程和论文分享活动,欢迎大家关注我们的公众号获取最新资讯!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
大学生参加学科竞赛有着诸多好处,不仅有助于个人综合素质的提升,还能为未来职业发展奠定良好基础。以下是一些分析: 首先,学科竞赛是提高专业知识和技能水平的有效途径。通过参与竞赛,学生不仅能够深入学习相关专业知识,还能够接触到最新的科研成果和技术发展趋势。这有助于拓展学生的学科视野,使其对专业领域有更深刻的理解。在竞赛过程中,学生通常需要解决实际问题,这锻炼了他们独立思考和解决问题的能力。 其次,学科竞赛培养了学生的团队合作精神。许多竞赛项目需要团队协作来完成,这促使学生学会有效地与他人合作、协调分工。在团队合作中,学生们能够学到如何有效沟通、共同制定目标和分工合作,这对于日后进入职场具有重要意义。 此外,学科竞赛是提高学生综合能力的一种途径。竞赛项目通常会涉及到理论知识、实际操作和创新思维等多个方面,要求参赛者具备全面的素质。在竞赛过程中,学生不仅需要展现自己的专业知识,还需要具备创新意识和解决问题的能力。这种全面的综合能力培养对于未来从事各类职业都具有积极作用。 此外,学科竞赛可以为学生提供展示自我、树立信心的机会。通过比赛的舞台,学生有机会展现自己在专业领域的优势,得到他人的认可和赞誉。这对于培养学生的自信心和自我价值感非常重要,有助于他们更加积极主动地投入学习和未来的职业生涯。 最后,学科竞赛对于个人职业发展具有积极的助推作用。在竞赛中脱颖而出的学生通常能够引起企业、研究机构等用人单位的关注。获得竞赛奖项不仅可以作为个人履历的亮点,还可以为进入理想的工作岗位提供有力的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值