Flink学习笔记（一）

最新推荐文章于 2023-10-08 19:06:54 发布

weixin_44205301

最新推荐文章于 2023-10-08 19:06:54 发布

阅读量76

点赞数

文章标签： flink 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44205301/article/details/133672491

版权

Flink简介:

Apache flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。

Flink特点：

一、批流统一：

Flink支持流式处理数据，也支持批式处理数据。

二、性能卓越：

高吞吐、低延迟

三、规模计算：

支持水平拓展架构

支持超大状态与增量检查点机制

例如：每天处理数万亿的事件。应用维护几TB大小的状态。应用在数千个CPU核心上运行。

四、生态兼容：

支持与Yarn集群集成。

支持与Kubernetes集成。

支持Standalone模式运行。

五、高容错：

故障自动重试。

一致性检查点。

保证故障场景下精确的一次的状态一致性。

Flink数据处理示意图：

事件驱动型：上游提供一批数据，处理一批数据。

流水线：上游数据像奔流的江水一样滔滔不绝，flink实时响应处理。

相关概念或术语：

有界流和无界流：

无界数据流：

特点：

有定义流的开始，但没有定义流的结束；（自然河流）

无休止产生数据。（用户日志数据）

数据必须持续处理，不能等数据都到达再处理。

有界数据流：

有定义流的开始，也有定义流的结束；（水坝开闸放水）。

有界流可以在所有数据抵达后再进行计算。

有界流数据可以被按照时间排序。所以不需要有序摄取。

相比较SparkStreaming的优势：

根本区别：SparkStreaming的核心是批处理。Flink的核心是流处理。

Spark采用的是RDD模型，而Spark Streaming的DStream实际上也就是一组组小批数据RDD的集合。

Spark运行时是批计算，将DAG划分为不同的stage，一个完成后才可以计算下一个。

Flink基础数据模型是数据流，以及时间Event序列。

Flink是标准的流执行模式，一个事件在一个节点处理完后可以直接发往下一个节点进行处理。

Flink的应用场景：

1）电商和市场营销：实时数据报表，实时推荐，广告投放。

2）物联网：传感器实时数据采集和显示

3）物流配送和服务业：订单状态实时更新、通知信息推送

4）银行和金融业：实时结算和消息推送。实时交易异常行为检测

weixin_44205301

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Flink学习笔记（一）

Apache flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行状态计算。
复制链接

扫一扫

weixin_44205301 CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

171万+: 周排名

25万+: 总排名

2497: 访问

: 等级

65: 积分

1: 粉丝

3: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

最新评论

Flink程序打包问题记录。
CSDN-Ada助手: 恭喜你写了第6篇博客！看到你记录了Flink程序打包的问题，真是太棒了。不过我觉得下一步可以尝试分享一些解决问题的方法或者经验，这样可以让读者更容易理解并受益。希望你能继续保持创作，期待你的下一篇博客！
Flink学习笔记（一）
CSDN-Ada助手: 非常棒的第5篇博客！恭喜你在Flink学习之路上的持续努力和创作！我对你的学习笔记感到非常感兴趣，期待能够从中学到更多关于Flink的知识。希望你能继续坚持下去，不断分享你的学习心得和经验。下一步，我建议你可以深入探索Flink的实际应用场景，并结合实际案例进行分析和讨论，这样可以为读者提供更实用的指导。再次恭喜你，并期待你的下一篇博客！
记录CDH断电后，cloudera-scm-server启动报错的问题
CSDN-Ada助手: 恭喜您开始博客创作！这是一个很好的开始，并且您选择了一个实际问题进行记录和分享。标题引人入胜，让人期待在您的博客中找到解决CDH断电后cloudera-scm-server启动报错问题的答案。接下来，我建议您可以进一步深入分析这个问题，并提供一些具体的解决方法或技巧，以便读者能够更好地理解和应用。期待看到您下一篇博客的发布！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
记录CDH断电后，cloudera-scm-server启动报错的问题
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/616897530。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。