推荐系统——学习笔记

一、一般步骤:

  • 1、收集用户偏好
  • 2、找到相似的用户或物品
  • 3、计算推荐

二、相似度计算:

在这里插入图片描述
在这里插入图片描述

三、常见方法:

协同过滤(基于统计):

1.基于用户的协同过滤

  • 要解决的问题
    • 已知用户评分矩阵Matrix R (一般都是非常稀疏的)
    • 推断矩阵中空格empty cells处的值
      在这里插入图片描述
  • 存在的问题
    • 对于一个新用户,很难找到邻居用户。
    • 对于一个物品,所有最近的邻居都在其上没有多少打分。
  • 基础解决方案
    • 相似度计算最好使用皮尔逊相似度。
    • 考虑共同打分物品的数目,如乘上min(n,N)/N ; n:共同打分数 N:指定阈值
    • 对打分进行归一化处理
    • 设置一个相似度阈值
  • 基于用户的协同过滤不流行的原因:
    • 稀疏问题
    • 数百万的用户计算,量太大
    • 人是善变的
  • 应用
    • 实时新闻
    • 突发情况

2.基于物品的协同过滤

  • 优势
    • 计算性能高,通常用户数量远大于物品数量
    • 可预先计算保留,物品并不善变
  • 应用
    • 图书
    • 电子商务
    • 电影

3.冷启动问题

  • 用户冷启动问题
    • 引导用户吧自己的一些属性表达出来
    • 利用现有的开放数据平台
    • 根据用户注册属性
    • 推荐排行榜单
  • 物品冷启动问题
    • 文本分析
    • 主题模型
    • 打标签
    • 推荐排行榜单

4.两种方法的比较

两种方法的比较

隐语义模型(基于建模,矩阵分解):

  • 从数据出发,进行个性化推荐
  • 用户和物品之间有者隐含的联系
  • 隐含因子让计算机能理解
  • 将用户和物品通过中介隐含因子联系起来
  • 隐语义模型
    在这里插入图片描述
  • 隐语义模型求解
    在这里插入图片描述
  • 隐语义模型负样本选择
    在这里插入图片描述
  • 隐语义模型参数选择
    在这里插入图片描述

协同过滤 && 隐语义

在这里插入图片描述

四、模型评估标准

模型评估标准
模型评估标准
Note: 评估标准远远不止这些,还要根据具体场景进行相对应的评估。

五、使用surprise进行实践

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值