用户留存建模实践

阿里云技术

于 2022-05-12 14:47:10 发布

阅读量163

点赞数

文章标签：云计算阿里云

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43970890/article/details/124731065

版权

本文探讨了用户留存建模在流量分析中的重要性，指出历史库方式存在的问题，提出滑动窗口计算模型的优势。通过设计实现用户留存建模组件，解决了计算效率、存储成本和冷启动问题，提高了研发效率，支持超过64位的留存指标计算。在蚂蚁版生意参谋的案例中，该组件实现了快速的数据链路重构和升级。

摘要由CSDN通过智能技术生成

一问题思考

在流量分析型产品的用户分析模块中，留存、互访、新老客构成等数据都是有效衡量用户粘性与促活召回的关键性指标；但是，我们发现在很多流量运营的业务场景中，留存分析建模都显著存在着设计和计算上的诸多问题，例如：各种历史库版本迭代的高额运维与存储成本、暴力计算、频繁计算、数据冷启动等问题。总结下来，有三个方面需要特别关注：

1、场景理解：在非常多的业务场景中，模型研发人员偏向于通过构建用户粒度的全量历史库，再去聚合用户的新老标签或历史累计次数，但关键问题是，在这些场景中基于历史行为计算的新老客标签和历史累计指标，并不适用于该业务场景下的精细化运营。比如，在用户增长领域的流失召回等场景策略中，长周期外仍然未有回访的用户显然不具备再运营的潜质（如180天等）；那么，相比基于历史库圈选新用户，改为基于动态滑动窗口的圈选策略，更具有可运营的潜质和解释性；并且，这种计算模式还可以有效地规避历史库回刷与冷启动问题。

2、计算模式：在计算模型的设计和模式构建上，大多数同学普遍缺少模型抽象与精细化设计。就累计去重指标或周期留存指标的计算实现来讲，大致有4种建模范式（想知道第5种请继续看下去）：

历史库方式：基于T+1全量和当日增量构建全量历史库，基于历史库再聚合
轻度聚合后再聚合：构建T+1的轻度聚合模型，多周期扫描再聚合
历史周期计拉链

最低0.47元/天解锁文章

阿里云技术

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用户留存建模实践

在流量分析型产品的用户分析模块中，留存、互访、新老客构成等数据都是有效衡量用户粘性与促活召回的关键性指标；但是，我们发现在很多流量运营的业务场景中，留存分析建模都显著存在着设计和计算上的诸多问题。本文将针对用户留存建模实践进行讨论。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。