Flink 流式计算框架（学习一）

最新推荐文章于 2024-08-29 10:45:33 发布

ljj234567

最新推荐文章于 2024-08-29 10:45:33 发布

阅读量2.9k

点赞数

分类专栏： flink 文章标签： flink

本文链接：https://blog.csdn.net/ka3p06/article/details/83988289

版权

flink 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

开源流计算引擎，兼顾性能和可靠性。

Flink数据集类型

有边数据集：最终不再发生改变

无边数据集：不断产生数据

Flink的两种执行模型

a.流计算

数据不断产生，一直处于计算状态

b.批处理

完成一定时间段的计算任务后，释放资源

Flink的特性

a.开源，分布式

b.结果精准，即使是无序数据或者延迟数据

c.有状态以及容错。维护精准一次的应用状态(保持每次计算的结果，向后传递，实现累加。容错：replace，计算错误后恢复)

d.可实现大规模计算，高吞吐、低延迟

f.通过检查点机制实现精准一次的计算保证，在出现故障的时候可以体现

e.flink支持计算以及窗口化操作

g.flink支持灵活的基础时间的窗口计算

h.flink容错是轻量级的，资源占用量少，保证零数据丢失

Flink流计算模型和有界数据集

a.有界数据集是无界数据集的一种特例

b.有界数据集在flink内部是以一种终态数据集进行计算

c.在flink中，有界和无界差距较小

d.使用同一套流计算执行引擎模型上的API操作两种数据类型

Flink启动

flink run -c ${classname} name.jar

默认端口

8081

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ljj234567

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

写给大忙人的笔记：一文梳理流式处理框架Flink

默主归沙的博客

04-13

705

一篇通俗易懂的Flink入门理论基础

Flink流式计算框架中的窗口函数

Running-小猛的博客

06-17

1322

一、窗口（window）（1）一般真实的流都是无界的，怎样处理无界的数据？（2）可以把无限的数据流进行切分，得到有限的数据集进行处理——也就是得到有界流；（3）窗口（window）就是将无限流切割为有限流的一种方式，它会将流数据分发到有限大小的桶（bucket）中进行分析；二、window类型（1）时间窗口（Time Window）：滚动时间窗口，滑动时间窗口，会话窗口；（2）计数窗口（Count Window）：滚动计数窗口，滑动计数窗口； 1、滚动窗口（Tumb..

参与评论您还未登录，请先登录后发表或查看评论

【Flink流式计算框架】Flink数据源

一梦

07-28

425

005Flink 获取source的方式（自带的）基于文件：readTextFile() 基于socket：socketTextStream 基于集合：fromCollection(Collection) 自定义数

Flink-大数据分布式流式计算引擎介绍

最新发布

似水_逆行的博客

08-29

1309

Flink-大数据分布式流式计算引擎介绍

Flink的流式计算模型与基本操作

AI天才研究院

01-25

1102

1.背景介绍 1. 背景介绍 Apache Flink 是一个流处理框架，用于实时数据处理和流式计算。它可以处理大规模数据流，并提供低延迟和高吞吐量。Flink 支持各种数据源和接口，如 Kafka、HDFS、TCP 流等。它还提供了丰富的数据处理功能，如窗口操作、状态管理、事件时间语义等。 Flink 的流式计算模型基于数据流和操作符。数据流是一种无限序列，每个元素表示数据的一部分。操作符...

Flink吐血总结，学习与面试收藏这一篇就够了！！！

悦上心灵的博客

09-11

533

Flink吐血整理，面试准备这一篇就够了

Flink流式计算从入门到实战一

roykingw的专栏

10-08

2211

文章目录一、理解Flink与流计算1、初识Flink2、Flink的适用场景3、流式计算梳理二、Flink安装部署1、Flink的部署方式2、获取Flink3、实验环境与前置软件4、集群搭建5、Standalone模式启动6、Yarn模式提交任务6.1、首先在yarn上启动yarn-session。6.2、提交测试任务6.3 Application Mode 应用模式6.4 Per-job Cluster Mode 单任务模式6.5 Session Mode 会话模式 Flink流式计算实战专题一 ==楼

万字长文详解大数据流式计算框架 Flink 实战（中篇）1

08-03

《万字长文详解大数据流式计算框架 Flink 实战（中篇）》是一篇深入探讨 Flink 流处理框架的教程，旨在帮助读者理解 Flink 的核心概念、API 使用、窗口与水印机制、状态管理和容错机制。本文将详细解析其中的关键...

Flink流式计算实际生产项目代码

12-19

总之，“Flink流式计算实际生产项目代码”是一个宝贵的实战教程，它揭示了Flink在系统运维监控中的具体应用，对于想要掌握Flink技术的开发者来说，是一份不可多得的学习材料。通过实践，你可以更深入地理解Flink的...

FusionInsight中Flink流式计算框架的应用与性能调优

# 章节一：Flink流式计算框架简介 ## 1.1 Flink框架概述 Apache Flink是一个开源流式计算框架，提供高吞吐量、低延迟的精确一次的流式数据处理，同时也支持批处理。它采用了基于事件时间的流水线来处理数据，实现...

大数据之Flink流式计算引擎

qq_46060451的博客

12-28

1734

Flink DataFlow 数据的分类有界数据离线的计算效率：硬件相同的情况下：时间无界数据实时的计算效率：硬件环境相同的情况下，吞吐量：数据处理的数量、延迟：结果输出的时间—数据接收的时间状态有状态无状态窗口函数滚动窗口数量–时间不重复滑动窗口可以重复滑动的间隔–窗口的宽度会话窗口不会重复基于某一个用户的未操作时间时间事件时间到达时间处理时间 Flink简介大数据计算引擎第一代:

flink流式处理框架的架构与应用

10-22

flink的技术分享，现在将我的ppt整理成文档：flink流式处理框架的架构与应用

【Flink流式计算框架】：基本概念（一）

Yuan_CSDF的博客

04-01

660

Flink的特性高吞吐、低延迟、高性能支持带事件时间的窗口（window）操作：time、count、session、data-driven 支持有状态计算的exactly once语义支持具有反压功能的持续流模型支持基于轻量级分布式快照（snapshot）实现的容错同时支持batch on streaming处理和Streaming处理 Flink在JVM内部实现了自己的内存管理支持迭代计算支持程序自动优化：避免特定情况下shuffle、排序等昂贵操作...

Flink新一代流式计算框架的体系架构及应用

我是Alvin家鸡鸭鱼的小米米

10-22

1647

近期在海数据社区的组织下，做了一次flink的技术分享，现在将技术分享的ppt和会议纪要做一个link。 https://www.hibigdata.cn/a/info/1/201.html

Flink的流式数据流式计算

AI天才研究院

01-18

1438

1.背景介绍流式数据流式计算是一种处理大规模、高速、实时数据的技术，它的核心是在数据流中进行实时计算和分析。随着大数据时代的到来，流式数据处理技术已经成为了一种必须掌握的技能。Apache Flink是一种流式数据处理框架，它可以处理大规模、高速的数据流，并提供实时计算和分析功能。在本文中，我们将深入探讨Flink的流式数据流式计算，揭示其核心概念、算法原理、代码实例等。 2.核心概念与联系...

数据湖：流计算处理框架Flink概述

渡江客涂鸦板

08-01

4184

Apache Flink是一个开源的流处理框架，应用于分布式、高性能、高可用的数据流应用程序。可以处理有限数据流和无限数据，即能够处理有边界和无边界的数据流。无边界的数据流就是真正意义上的流数据，所以Flink是支持流计算的。有边界的数据流就是批数据，所以也支持批处理的。不过Flink在流处理上的应用比在批处理上的应用更加广泛，统一批处理和流处理也是Flink目标之一。Flink可以部署在各种集群环境，可以对各种大小规模的数据进行快速计算。............

Flink流式计算测试

weixin_36852563的博客

12-26

643

流式计算框架有Strom，Spark，Flink 目前Spark主要应用于离线数据批量导入，相比于XDATA导入工具是有逻辑处理的，微批处理能力不错； Strom主要应用于MQ的实时消费（push过来的数据），来一条数据处理一条数据，实时性比较好 Flink大数据的新趋势，功能强大，批处理和实时处理，丰富的窗口功能： checkpoint：保证数据不丢失 offset：每一条消息有个位置标记以便于系统出故障时可以重新消费，flink内存：统计计算 Event time （事件时间）：印刷时间比如

Flink分布式流式处理框架

weixin_50648720的博客

01-22

1543

FlinkFlink概述数据流与流计算Flink简介应用场景Flink架构安装配置示例演示单词统计示例创建Flink工程 Flink概述数据流与流计算数据流是一串连续不断的数据的集合，就象水管里的水流，在水管的一端一点一点地供水，而在水管的另一端看到的是一股连续不断的水流。类似于人们对河流的理解本质上也就是流的概念，但是这条河没有开始也没有结束，数据流非常适合于离散的、没有开头或结尾的数据。例如，交通信号灯的数据是连续的，没有“开始”或“结束”，是连续的过程而不是分批发送的数据记录。通常情况下，数据流对

Flink流式计算处理

justlpf的专栏

09-30

975

参考文章：Flink流式计算处理 Storm缺点: 1. 并不能保证exactly-once(精确一次), 2. 能保证低延迟,但不能保证高吞吐(即便是它能够保证的正确性级别高,其开销也相当大) 3. Storm Trident是对Storm的延伸,它的底层流处理引擎就是基于微批处理方法来进行计算的, 从而实现了exactly-once语义, 但是在延迟性方面付出了很大的代价. Spark Streamming缺点: Spark通过间歇性的批处理作业来模拟流处理,会导致开发和运维相互交错

Flink流式计算实战：API、Window与Watermark深度解析

"这篇长文深入讲解了大数据流式计算框架Apache Flink的实战应用，主要聚焦在Flink的API、窗口（Window）和水印（Watermark）机制上，同时还涉及到了状态管理和容错机制等内容。" 在大数据处理领域，Apache Flink是...