基于内容推荐流程

基于内容推荐流程

①建立物品画像

  • ①用户打tag②电影的分类值
  • 根据电影的id 把tag和分类值合并起来 求tf-idf
  • 根据tf-idf的结果 为每一部电影筛选出 top-n(tf-idf比较大的)个关键词
  • 电影id-关键词-关键词权重

②建立倒排索引

  • 通过关键词找到电影
  • 遍历 电影id-关键词-关键词权重 数据,读取每一个关键词,用关键词作为key[(关键词对应的电影id,tfidf)]作为value 保存到dict当中

③用户画像

  • 看用户看过那些电影,到电影的 电影id-关键词-关键词权重 数据中 找到电影所对应的关键词
  • 把用户看过的所有的关键词放到一起 统计词频 每个词出现了几次
  • 出现次数多的关键词 作为用户的兴趣词,这个兴趣词实际上就是用户画像的关键词

④根据用户的兴趣词 找到兴趣词对应的电影 多个兴趣词可能对应一个电影{电影id:{关键词1权重,关键词2权重}}

  • 把每一部电影对应的关键词权重求和之后 排序 权重比较高的排在前面 推荐给用户
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值