content-based recommendation 概述认识的强化版

参考:Content-based Recommendation Systems


Content-based Recommendation Systems 目的是找到 item 与用户偏好的相似度。


1 item representation
item表示一般有两种:一种是结构化的数据,一般存储于数据库中。另外一种是非结构化的数据,比如一篇文档。非结构化的数据不好表达,一般将其转化为结构化数据。通常采用IR领域搜索方面所用的技术,将一篇文章提炼为关键词的集合(做一些处理,如同义词合并)。然后采用tf-idf为关键词计算其权重。但是这样的关键词集合的表示,不能区分(不是XX这样的语义。)进一步的改进是,使用连续的词作而不是单个词作为关键词


2 User Profiles
用户行为有很多种,该文重点列出了两类。
a用户兴趣建模。用户兴趣建模的方法有很多种,其共同的表达是:a function that for any item predicts the likelihood that the user is interested in that item (一个预测用户对item集合中的每一item的喜好程度)。下面会列出几种用户建模的方法
b 用户行为的历史记录。可以是显式的可以是隐式的,但需要知道用户以往使用该系统的记录。这些行为数据可以用来过滤掉推荐系统给出结果中用户在以往已经阅读/购买的,另一方面这些行为数据可以用来作为机器学习算法建模的训练数据。


3learning user model
构建用户偏好模型就是根据用户历史而进行的分类学习。将训练数据分类几类(如简单的喜欢/不喜欢 ,复杂的等级&#
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值