b站推荐系统实战笔记

推荐系统和搜索的区别

在这里插入图片描述

大数据lambda结构

  • 推荐系统架构
    在这里插入图片描述
  • hadoop、sql、spark都是离线处理数据的工具
  • 数据离线处理和在线处理,不同的框架和工具

在这里插入图片描述

lambda架构

  • 作用:解决实时计算+离线计算共同提供服务的问题;
  • 离线计算:
    • 框架:hadoop/spark core/spark sql/hive
    • 优点:树立数据量大pb级别
    • 缺点:速度慢,分钟级别延迟
  • 实时计算:
    • 框架:spark streaming/storm/flink
    • 优点:速度快,毫秒级别延迟
    • 缺点:处理的数据量小;
  • 消息中间件
    • flume:日志采集系统
    • kafka :消息队列
  • 存储相关
    • hbase nosql数据库
    • hive sql操作hdfs数据

推荐系统架构

  • 召回:推荐系统的天花板,决定物品会不会出现在后续的排序中;
    • 协同过滤 u2u/i2i;
    • embedding相似度;
  • 排序:
  • 策略调整:有一些前边相似度计算/客观广告等要求的重排序或者过滤操作;

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值