《推荐系统实战宝典》第1章 推荐系统概述

今天有空总结一下在图书馆借阅的一本机工出版的《推荐系统实战宝典》,里面很多概念我很多都不会,以后有空回来再修改补全我的理解

1.背景

从信息匮乏到信息过载过程,出现两种解决办法,搜索引擎和推荐系统。
推荐系统相对搜索引擎更倾向于没有明确目标的用户,根据其现状来返回其有潜在的需求结果或者感兴趣的结果,意义在于挖掘长尾项目的潜在利润。

长尾项目:指相对于曝光率高的项目来说的低曝光率的项目容易被忽视

1.1 出现的场景

1.电商里出现的"猜你喜欢"
2.只知道起点和终点,打开地图软件,系统推荐好几种线路
3.微博热搜榜
4.音乐软件的推荐歌单
5.通勤时候看到今日头条会根据你的历史阅读习惯,推送相似的内容

总结:推荐系统,从收益角度分析什么样的推荐系统是好的推荐系统,能在用户搜索零食时候还推荐可乐(让用户联想起吃零食还能买喝的解渴),这样推动了推荐系统多挣一笔收益,也让提醒了用户有潜在的需求。又或者说,当系统推送文章栏目种,让用户发现到一篇很符合其口味的文章,但这种文章平时根据自己喜好又搜不出来,这种也属于好的推荐系统。

1.2 推荐系统架构

一般分为以下6个模块如下

  1. 底层基础数据:基础数据分为用户数据和物品数据。
  2. 数据加工存储:可以对用户数据做用户画像,同样也有物品画像,进行特征工程的提取。
  3. 召回内容
  4. 计算排序
  5. 过滤和展示
  6. 业务应用

一图胜千言如下:
图1 推荐系统通用架构图

3.推荐系统架构治理

当前推荐系统的基本架构,一般分为5个板块

  1. 数据流:数据怎么获取,怎么用,怎么加工,正确性和时效性怎么保证等问题
  2. 离线板块:涉及加工处理,模型生产,指标报表等离线任务,怎么协调这些任务高校进行,并获取正确有效结果。
  3. 在线板块:实时推荐的能力,能够适应快速变化且保证可用性和性能至关重要。
  4. AI:整个AI模型生成到服务的全生命周期,有机集成到系统是一个挑战
  5. 基础设施:这是多领域交叉的综合应用,多个中间件,基础组件做支撑,如何管理和运维,减少以来,有效利用是很重要的命题

书中还提及到淘宝推荐引擎系统结构和网飞的推荐架构这两个例子

4.评测推荐结果的实验方法

  1. 离线实验:只关心模型拟合能力
  2. 用户调查:获取用户主观感受的指标
  3. 在线实验:AB测试,也即对用户分组用不同的算法,使用一些指标来判断算法的性能

评测指标

  1. 用户满意度:最重要指标
  2. 预测准确度:
  3. 准确率,精确率,召回率,覆盖率

5.推荐系统知识储备

下面是知识架构图
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值