推荐系统 自学指南 (一)

本文探讨了推荐系统产生的背景,包括其与搜索引擎的区别,工作原理(如社会化、内容、流行度和协同过滤),以及在信息流中的应用。着重介绍了推荐系统设计,如整体架构、大数据Lambda架构和推荐算法(召回、排序、CTR预估),以及模型构建流程。
摘要由CSDN通过智能技术生成

1 概念

1.1 产生背景

信息过载
用户需求不明确

1.2 推荐系统是什么

没有明确需求的用户访问了我们的服务,且服务的物品对用户构成了信息过载。系统通过了一定的规则对物品进行了排序,并将排在前面的物品展示给用户。

1.3 推荐系统 VS 搜索引擎

#搜索推荐
行为方式主动被动
意图明确模糊
个性化
流量分布马太效应长尾效应
目标快速满足另类服务
评估指标简明复杂

1.4 推荐系统的工作原理

  • 社会化推荐 向朋友咨询,社会化推荐,让好友给自己推荐物品
  • 基于内容的推荐打开搜索引擎,输入自己喜欢的演员,然后看看返回结果中还有什么电影是自己没有看过的
  • 基于流行度的推荐 查看票房排行榜
  • 基于协同过滤的推荐 找到和自己历史感兴趣的用户,看看他们最近在看什么电影

1.5 推荐系统的应用场景

  • feed流 信息流

推荐系统和Web项目的区别

  • 稳定的信息流通系统 VS 通过信息过滤实现目标提升

    • web项目: 处理复杂逻辑,处理高并发,实现高可用,为用户提供稳定服务,构建一个稳定的信息流通的服务
    • 推荐系统:追求指标增加,留存率,阅读时间/GMV
  • 确定 VS 不确定思维

    • web项目:对结果有确定预期
    • 推荐系统:结果是概率问题

2 推荐系统设计

2.1 推荐系统整体架构

在这里插入图片描述

2.2 大数据Lambda架构

结合实时数据和离线数据共同提供服务
在这里插入图片描述

2.3 推荐算法架构

  • 召回阶段(海选)
    • 召回决定了最终推荐结果的天花板
    • 常用算法
      • 协同过滤
      • 基于内容(根据用户行为总结出自己的偏好 根据偏好通过文本挖掘技术找到内容上的相似商品)
      • 基于隐语义
  • 排序阶段
    • 召回决定了最终推荐结果的天花板,排序逼近了这个极限,决定了最终的推荐效果
    • CTR预估(点击率预估 使用LR算法)估计用户是否会点击某个商品 需要用户的点击数据)
  • 策略调整
    在这里插入图片描述

2.3 推荐系统的整体架构

在这里插入图片描述

推荐算法

推荐模型构建流程
Data(数据) -> Feature -> ML Algorithm -> Prediction Output

  • 数据清洗/数据处理
    在这里插入图片描述
  • 数据来源
    • 显性数据
      • Rating 打分
      • Comments 评论/评价
    • 隐形数据
      • 历史订单
      • 加购物车
      • 页面浏览
      • 点击
      • 搜索记录
  • 数据量/数据是否满足需求
  • 特征工程
    在这里插入图片描述
  • 从数据中筛选特征
    • 协同过滤:用户-物品 评分矩阵
    • 基于内容:分词 tf-idf word2Vec
  • 训练模型
    召回 -> 排序 -> 策略调整
    • 协同过滤
      • KNN
      • 矩阵分解
  • 评估、模型上线
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值