2020 Hulu AI Class 笔记

本文详细介绍了推荐系统的传统算法模型,包括协同过滤、矩阵分解、逻辑回归和因子分解机,以及梯度提升树在推荐中的应用。接着探讨了特征工程的重要性,如数据清洗、特征转换和选择。进一步讲解了Embedding的概念和作用,并概述了深度神经网络模型在推荐系统中的应用。最后,文章讨论了工业级推荐模型的架构和推荐流程。
摘要由CSDN通过智能技术生成

推荐算法模型1

传统推荐算法模型

推荐系统

  1. 目的:建立一个数学模型或者目标函数去预测用户在某一特定场景下对某个物品的偏好程度。
  2. 关键:用户、物品、场景

最简单的推荐模型:协同过滤

  1. 用户对物品的评价:显式评价(用户直接打分)、隐式评价(从用户的行为推断,观看时间、点击次数)。前者需要用户额外的工作,不容易获取,后者相反。
  2. 交互矩阵:记录每个用户对物品的评价。
  3. 从矩阵中已有的值预测矩阵中没有出现的评价。
    交互矩阵
  4. 协同过滤不考虑用户所处场景,物以类聚人以群分,思想在于:the users who have agreed in the past tend to also agree in the future.
  5. 将用户对于某个物品的偏好值建模为一系列相似的用户或者相似的物品的一系列加权组合。
    r u , i = ∑ v w u v ⋅ r v , i #  of neighbors  r_{u, i}=\frac{\sum_{v} w_{u v} \cdot r_{v, i}}{\# \text { of neighbors }} ru,i=# of neighbors vwuvrv,i
  6. 关键:如何定义相似度。
  7. 常见相似度计算方法:余弦相似度(衡量两个向量夹角的大小)、皮尔逊系数(使用了用户的平均分,减少不同用户之间的喜好评价差异)……

常见相似度计算方法
8. 相似度计算的改进:对于大多数人都喜欢的作品的喜爱可能不具有很大参考性,应该对具有比较大争议的增加权重;计算相似度的时候考虑共同观看的剧的集数;设置条件过滤掉不是很相似的用户,设置阈值和最大相似用户数(邻居数)
9. 协同过滤的优劣:好处,好计算、可解释;坏处,需要大的内存、数据稀疏导致预测不准。

矩阵分解模型

  1. Intuition:表达更高级的属性

  2. 对每个用户和物品嵌入embeddings(隐含了很多特殊信息的向量)

  3. 将交互矩阵分解成为两个低秩矩阵获得embeddings。左边矩阵可以分解为右边两个矩阵的点积。矩阵分解的过程为最小化右下角的目标函数:第一项为使embeddings重构交互矩阵的误差尽可能小,第二项为正则项。优化问题可以通过梯度下降的方法来完成。
    在这里插入图片描述

  4. 有了embeddings后可以加入不同的元素,即在模型里面加入不同的偏置。

  5. 矩阵分解的优劣:优势,有一定泛化能力,存储空间小(只需存储低维的embeddings向量);劣势:比起协同过滤来说更难解释,以及稀疏性问题。

逻辑回归模型

  1. Intuition: add context information to our model
  2. 将推荐建模成为二分类任务,预测用户和物品产生交互的概率,根据概率的大小来推荐。二分类分为:会交互、不会交互两类。
  3. r u , i = 1 1 + e − ( W x + b ) r_{u, i}=\frac{1}{1+e^{-(W x+b)}}
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值