Flink流式计算测试

最新推荐文章于 2024-01-25 01:55:14 发布

四叶草0423

最新推荐文章于 2024-01-25 01:55:14 发布

阅读量635

点赞数 1

分类专栏：大数据测试文章标签：大数据 flink kafka 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36852563/article/details/111769932

版权

大数据测试专栏收录该内容

4 篇文章 1 订阅

订阅专栏

流式计算框架有Strom，Spark，Flink

目前Spark主要应用于离线数据批量导入，相比于XDATA导入工具是有逻辑处理的，微批处理能力不错；

Strom主要应用于MQ的实时消费（push过来的数据），来一条数据处理一条数据，实时性比较好

Flink大数据的新趋势，功能强大，批处理和实时处理，丰富的窗口功能：

checkpoint：保证数据不丢失

offset：每一条消息有个位置标记以便于系统出故障时可以重新消费，flink内存：统计计算

Event time （事件时间）：印刷时间比如前段埋点的时间，目前一般用的Event time,但如果Event time也有些延迟的话，需要借助设置水位来缓冲，保证数据不丢失

Windows窗口：

Tumbling Windows（翻转窗口）
在这里插入图片描述

Sliding Windows（滑动窗口）

在这里插入图片描述

window slide: 精准度

window size:窗口大小

Session Windows（会话窗口）

在这里插入图片描述

Time时间：

Event time （事件时间）：印刷时间比如前段埋点的时间

Ingestion time（提取时间）：提取时间数据采集的时间

Processing time（处理时间）：处理时间 flink处理时间

Watermarks水印：

在这里插入图片描述

案例：

实时特征计算：

要求数据实效性达到秒级

最近15分钟保险勾选、取消次数
最近30分钟保险勾选、取消次数
最近60分钟保险勾选、取消次数

采用的滑动窗口

KAFKA消息单位时间内统计：比如统计保险15min点击勾选数

1、每5S收集一次后再进行叠加计算

2、flink窗口计算

3、内存存储是否足够

4、消息是否有丢失

测试功能点：

数据来源正确性验证

消息正确性验证

消息丢失率验证

flink窗口测试

流式计算测试

内存存储测试

故障恢复测试

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。