推荐系统7---基于内容的推荐(ContentBasedRecommend)

这篇笔记,重点在于解决以下三个问题:
这篇论文解决了什么问题?
创新点在哪里?
实验结果怎么样?

1,前言

本篇文章又回到传统推荐方式——协同过滤部分的内容。协同过滤分为基于用户的协同过滤(userCF)和基于物品的协同过滤(itemCF)。本篇文章要讲的基于内容的推荐方式,属于协同过滤部分的内容。
基于内容的推荐,是什么?
它是以物品的内容描述信息为依据做出的推荐,本质上是基于对物品和用户自身的特征或者属性直接分析和计算。更直白的来说,就是事先给出物品画像和用户画像,这样,我们就能根据用户喜欢什么直接给用户推荐物品。比如我们知道电影A是一部喜剧,同时我们知道某个用户喜欢喜剧,那我们就可以将电影A推荐给用户。
基于内容的推荐涉及到的技术细节有哪些?
1,构建用户画像(给用户打标签),那么如何给用户打标签?
2,构建物品画像(给物品打标签),那么如何给物品打标签?
3,如何解决物品的冷启动问题?
本文将通过movielens数据集,把基于内容的推荐流程走一遍,这里面会涉及到tf-idf技术,word2vec技术,doc2vec技术等。遇到的,我们就都了解一下。
基于内容的推荐,整体流程是什么?
1,建立物品画像
1,基于用户给电影打的tag和电影的分类值,得到每一部电影的总标签
2,求每一部电影标签的tf-idf值
3,根据tf-idf的结果,为每一部电影选择top-n(tf-idf值较大)的关键词作为整部电影的关键词
4,最后得到电影id——关键词——关键词权重
2,建立倒排索引
1,目的是为了根据关键词找到对应的电影,便于后面得到用户画像(用户喜欢什么样的电影)之后对用户进行一些推荐
3,建立用户画像
1,看用户看过哪些电影,基于前面的物品画像找到电影对应的关键词
2,把用户看过的所有关键词放在一起,统计词频(每个词出现的次数)
3,将出现次数最多的关键词作为用户的兴趣词,这个就是用户的画像
4,根据用户的兴趣词,基于倒排表找到电影,对用户实施推荐。
本篇文章的基本大纲是什么?

  • 基于内容的推荐算法
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值