基于Redis+Kafka的首页曝光过滤方案

本文来自网易云社区


作者:李勇


  • 背景

  网易美学首页除了banner和四个固定位,大部分都是通过算法推荐获取的内容,其中的内容包括心得、合辑、视频及问答等。现在需要实现的是当推荐内容在用户屏幕曝光后(即用户一个屏幕内的内容),那么这些内容在一定时间内,如两周内都不能再出现,因此需要对这些已经曝光过的内容进行过滤。首页内容如下图所示:



 20180903143644882b9803-1237-4065-bb8c-90d247dae2fd.jpg


  • 实现方案

  目前的实现方案是客户端对用户曝光的内容进行采集,然后通过DA的SDK将这些数据发送到Kafka Broker,然后再通过Kafka消费者去消费并解析这些数据,再将解析后的数据同步到Redis中。当用户再次获取数据时算法端会从Redis中获取需要过滤的数据,再将最终推荐内容返回服务端,然后服务端去业务数据库查询算法返回的数据对应的完整信息,最后将完整信息返回给客户端,客户端对数据进行渲染展现给用户。


  具体实现分为两道工序:一个是曝光数据的收集,另一个是对曝光数据的过滤。


  • 曝光数据的收集

  数据的收集步骤如下:

  1. 客户端收集用户的曝光内容;

  2. 客户端通过DA的SDK将收集到的用户曝光内容发送到Kafka集群;

  3. 实时计算工程实时拉取Kafka的内容;

  4. 提取出曝光内容再进行解析;

  5. 将解析后的内容以Sorted Set数据结构维护到Redis中。


  曝光数据的收集时序图如下图所示:

         201809031437263ddba141-f50a-4245-947e-39e6c4efb9a3.png


  • 曝光数据的过滤

  数据的过滤步骤如下:

  1. 用户使用客户端刷新首页数据;

  2. 客户端向服务端请求首页数据;

  3. 服务端在向算法端发送请求获取首页数据;

  4. 算法端根据服务端发送的用户个人信息,如用户id,用户设备id等信息,计算出推荐内容;

  5. 算法端从Redis中获取该用户最近两周的曝光数据进行过滤;

  6. 算法端将过滤后的推荐内容id和内容类型返回给服务端;

  7. 服务端根据算法返回的内

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值