Flink 在字节跳动数据流的实践

最新推荐文章于 2023-04-12 16:28:30 发布

倾听铃的声

最新推荐文章于 2023-04-12 16:28:30 发布

阅读量425

点赞数

分类专栏：后端文章标签： flink 大数据 big data java 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67698950/article/details/125245121

版权

本文介绍了字节跳动数据流业务的规模与挑战，包括处理海量埋点数据、ETL任务管理和实时数据治理。字节跳动使用Flink构建数据流ETL链路，面对流量大、任务频繁变更、高SLA要求等问题，通过数据分流、动态规则更新和Flink任务拆分等策略提升系统稳定性和效率。此外，还讨论了Flink在字节跳动的演进和治理实践。

摘要由CSDN通过智能技术生成

字节跳动数据流的业务背景

数据流处理的主要是埋点日志。埋点，也叫 Event Tracking，是数据和业务之间的桥梁，是数据分析、推荐、运营的基石。

用户在使用 App、小程序、Web 等各种线上应用时产生的行为，主要通过埋点的形式进行采集上报，按不同的来源分为客户端埋点、Web 端埋点、服务端埋点。

不同来源的埋点都通过数据流的日志采集服务接收到 MQ，然后经过一系列的 Flink 实时 ETL 对埋点进行数据标准化、数据清洗、实时风控反作弊等处理，最终分发到下游，主要的下游包括 ABTest、推荐、行为分析系统、实时数仓、离线数仓。

所以，如果用一句话来概括数据流主要业务，其实就是埋点的收集、清洗、分发。

目前在字节跳动，清洗和分发环节是基于 Flink 搭建的。

01 - 数据流业务规模

业务数量：在字节跳动，包括抖音、今日头条、西瓜视频、番茄小说在内的 3000 多个大大小小的 APP 和服务都接入了数据流。
数据流峰值流量：当前，字节跳动埋点数据流峰值流量超过 1 亿每秒，每天处理超过万亿量级埋点，PB 级数据存储增量。
ETL 任务规模：目前，字节跳动数据流在多个机房部署超过 1000 个 Flink 任务和超过 1000 个 MQ Topic，使用超过 50W Core CPU，单任务最大 12W Core CPU ，Topic 最大 10000 Partitio。

02 - 数据流业务挑战

字节跳动数据流 ETL 遇到的挑战主要有四点：

第一点，流量大，任务规模大。
第二点，处在所有产品数据链路最上游，下游业务多，ETL 需求变化频繁。
第三点，高 SLA 要求，下游推荐、实时数仓等业务对稳定性和时效性有比较高的要求。
最后一点，在流量大、业务多、SLA 要求高的情况下，针对流量、成本、SLA 保障等多维度的综合治理也面临挑战。

下面从两个数据流业务场景中介绍一下我们遇到的业务挑战。

1、UserAction ETL 场景

在 UserAction ETL 场景中，我们遇到的核心需求是：种类繁多且流量巨大的客户端埋点需求和 ETL 规则动态更新的需求。

在字节内部，客户端的埋点种类繁多且流量巨大，而推荐关注的只是部分埋点，因此为了提升下游推荐系统处理效率，会在数据流配置一些 ETL 规则，对埋点进行过滤，并对字段进行删减、映射、标准化之类的清洗处理，将埋点打上不同的动作类型标识。

处理之后的埋点一般称之为 UserAction，UserAction 数据会和服务端展现等数据在推荐 Joiner 任务的分钟级窗口中进行拼接 Join，产出 Instance 训练样本。

举个例子：一个客户端的文章点赞埋点描述了用户在一个时间点对某一篇文章进行了点赞操作，埋点经过数据流日志采集服务进入数据流 ETL 链路，通过 UserAction ETL 处理后实时地进入到推荐 Joiner 任务中拼接生成样本更新推荐模型，从而提升用户体验。

如果产出 UserAction 数据的 ETL 链路出现比较大的延迟，那么就不能在窗口内及时完成拼接，可能导致用户体验下降。

因此对于推荐来说，数据流的时效性是一个强需求。

而推荐模型的迭代、产品埋点的变动都可能导致 UserAction 的 ETL 规则的变动。如果 ETL 规则硬编码在代码中，每次修改都需要

最低0.47元/天解锁文章

倾听铃的声

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

倾听铃的声 CSDN认证博客专家 CSDN认证企业博客

码龄3年

771: 原创

16万+: 周排名

102万+: 总排名

61万+: 访问

: 等级

8919: 积分

421: 粉丝

504: 获赞

221: 评论

2401: 收藏

私信

关注

热门文章

分类专栏

后端 751篇
Java 64篇
前端 5篇
Java
MySQL
分类 1篇

最新评论

SpringCloud微服务项目搭建流程
飞羽疾驰: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
tcp 为什么要三次握手，两次不行吗？为什么？
2401_82668611: 为啥重传syn报文要改isn？不改这样服务器不就可以区别是重传吗？
推荐 7 个牛哄哄 Spring Cloud 实战项目
天蓝999: 可以的，我看的另一个SpringCloud项目视频，从零开发，五天学会了SpringCloud项目实战：https://knife.blog.csdn.net/article/details/134659054
java常用数据结构有哪些
2301_79822942: 全是慢慢干货，作者好棒啊
大小厂必问 Java 后端面试题（含答案）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

倾听铃的声 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。