数据采集实战:某feed流产品的数据采集历程

业务背景

在这里插入图片描述

明确需求

在这里插入图片描述评论数和点赞数对用户点击有没有促进?可先进行埋点,后续进行分析

埋点事件确定

在这里插入图片描述
在这里插入图片描述确定埋点事件
在这里插入图片描述

属性拆解

在这里插入图片描述各事件:
在这里插入图片描述在这里插入图片描述想看下拉几次和间隔时长,判断用户的依赖程度,和加载相同

触发时机

在这里插入图片描述

属性来源

在这里插入图片描述展示时长,需要弄一个计时器?和研发商量
加载次数存在哪里比较合适?
时长=结束时间-开始时间,分别从哪取比较合适?

与RD沟通

在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述时长后一个时间戳的确定:前一个时间戳来自API,后一个自然来自API比较合理
细节确认:单日的定义为自然日
在这里插入图片描述

数据检验

发现的坑
1)“卡片展现”、“卡片点击”的位置属性时常出现0
原因:计算机数组元素默认从0开始,忘记加1
2)“加载更多”的加载间隔时长有时候会出现极大的值(几万秒)
原因:出现了边缘case,加载的时候退出App,几个小时回来触发下拉刷新,和研发商定将之前的时间戳设定为当前时间

版本信息更新

目的:维护文档,方便后续使用者能更清楚更快速熟悉
在埋点表中更新版本号
常见的值写在备注中
在这里插入图片描述

新需求

在这里插入图片描述在推荐理由中添加InstantRec
在这里插入图片描述在这里插入图片描述
背后原因:卡片在列表中位置在第一次请求feed接口时客户端统一计算分配的,基于刚刚阅读的资讯实时推荐出来的卡片是单独插在列表里的,并没有重新分配所有卡片位置的过程,确定此问题后,和研发确定解决方案:从资讯页回到推荐feed流时,列表的位置id重新刷新计算。

更新文档

在这里插入图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值