- 博客(422)
- 收藏
- 关注
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第一节Flink CEP介绍和第二节模式API(一))
通过入门示例让读者感受一下CEP,接下来就介绍了其编程模型。
2025-12-22 14:45:00
28
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(整章)
分为2个部分介绍了Flink的监控与优化,即Flink提供了哪些指标以及如何监控和Flink优化的方向有哪些及怎么优化。
2025-12-22 10:15:00
219
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第七节流式聚合调优及第八节本章小结)
介绍了Flink在聚合时的优化,主要是从聚合时的状态查询、数据倾斜以及distinct的拆分几个方面进行说明。Flink在进行聚合时需要读取状态信息(累加器)、修改和写回累加器,该操作会增加状态后端的开销,启用MiniBatch聚合可以将聚合算子存储在缓冲区中,当然该种方式可能会有一定的延迟发生,需要进行吞吐量与延迟做好平衡。本地聚合则是解决数据倾斜的情况,启动本地聚合可以实现先上游本地聚合再下游全局聚合,其依赖与已经启用来MiniBatch聚合。拆分distinct则是通过两级聚合完成distinct
2025-12-21 15:30:00
77
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第六节网络缓冲调优)
从网络方面给出了如何进行优化,比如网络的缓冲消胀机制、网络缓冲的生命周期和缓冲区的数量等知识介绍的同时如何进行优化。网络缓冲消胀机制如何配置和可能获得结果以及使用限制场景;网络缓冲的生命周期则是从输入和输出网络两个方面进行介绍;缓冲区的数量则是介绍了Flink本身默认值是多少,其默认值一般来说不需要修改就足以应对一般的业务场景。
2025-12-21 10:15:00
87
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第三节监控反压、第四节内存调优及第五节大状态与检查点调优)
介绍了Flink作为一个实时计算框架不可避免会遇到的事情-反压,其如何进行监控、如何界定是否出现了反压等相关内容。并通过一个示例介绍了Flink是如何来标明反压状态的。
2025-12-19 15:30:00
179
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第二节示例:Flink 的指标报告)
介绍了Flink作为一个实时计算框架不可避免会遇到的事情-反压,其如何进行监控、如何界定是否出现了反压等相关内容。并通过一个示例介绍了Flink是如何来标明反压状态的。
2025-12-19 13:45:00
182
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第一节Flink 指标体系)
介绍了Flink的指标体系,其中包含指标的注册、范围、报告生成、系统指标有哪些、端到端的延迟跟踪、状态访问延迟跟踪和指标体系通过Restful API 和Dashboard的集成内容。第二节则是第一节的延续,是针对将Flink的指标与外部系统的集成,介绍了如何进行集成,并介绍了哪些软件可以和Flink直接进行集成,并以与JMX集成作为示例进行说明,目前比较流行的可能是与Prometheus的集成,至于如何应用则以实际的应用环境为准。
2025-12-19 10:15:00
185
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(整章)
分别从DataStream 和 Table API & SQL两个方面介绍外部连接器的支持与使用情况,为了更加贴近我们实际生产应用和系统应用,不管是DataStream的外部连接器还是Table API & SQL 的外部连接器本书都是选取的Kafka作为重点介绍的内容。当然结合当前行业的市场存量情况,Flink与Hadoop、Hive的结合应用也较为常见,本章以HDFS为应用基础介绍了文件系统。
2025-12-18 15:30:00
372
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(三)及第三节本章小结)
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-18 13:45:00
304
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(二))
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-18 10:15:00
237
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(一))
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-17 14:45:00
276
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第一节DataStream 连接器之Kafka(二))
第一节介绍了DataStream的Connector的内容。该节介绍了Flink外部连接器容错保证和重要的一个外部连接器kafka。Flink 的外部连接器kafka在使用的时候会有哪些困惑?本小节从怎么引入、kafka作为source和sink的使用方式以及示例进行说明、kafka作为外部连接器的版本变化、kafka在运行过程中的监控、安全、版本升级等,甚至包括使用过程中出现了异常如何解决等。
2025-12-17 10:15:00
291
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第一节DataStream 连接器之Kafka(一))
第一节介绍了DataStream的Connector的内容。该节介绍了Flink外部连接器容错保证和重要的一个外部连接器kafka。Flink 的外部连接器kafka在使用的时候会有哪些困惑?本小节从怎么引入、kafka作为source和sink的使用方式以及示例进行说明、kafka作为外部连接器的版本变化、kafka在运行过程中的监控、安全、版本升级等,甚至包括使用过程中出现了异常如何解决等。
2025-12-16 14:45:00
325
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(整章)
本章简略的介绍了Flink Table API & SQL 的内容,其中内容是Flink的核心功能之一,与DataStream API、Connector连接器是非常核心功能,其中Table API & SQL 较其他两者更为重要。其中非常重要的时区、SQL Cli、SQL Gateway、模块以及Table API等相关内容本书没有介绍或介绍极其简略,同时也缺乏相对的示例,特别是Table API与DataStream API的集成相关内容。
2025-12-16 10:15:00
1429
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第八节Catalogs(二)及本章小结)
本节介绍了catalogs的分类以及Flink的表如何注册到catalog中
2025-12-15 14:45:00
600
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第八节Catalogs(一))
本节介绍了catalogs的分类以及Flink的表如何注册到catalog中
2025-12-15 10:15:00
473
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第七节函数(二))
本节介绍了Flink的系统内置函数与自定义函数的开发过程及示例
2025-12-12 15:30:00
538
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第七节函数(一))
本节介绍了Flink的系统内置函数与自定义函数的开发过程及示例
2025-12-12 13:30:00
522
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第六节窗口(二))
第六节讲述了Flink非常重要的应用-窗口的应用,介绍了滑动、滚动和累积窗口,并介绍了窗口的聚合,同时讲述了Top-N和窗口的Top-N,以详细的示例进行说明。
2025-12-12 10:15:00
534
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第六节窗口(一))
第六节讲述了Flink非常重要的应用-窗口的应用,介绍了滑动、滚动和累积窗口,并介绍了窗口的聚合,同时讲述了Top-N和窗口的Top-N,以详细的示例进行说明。
2025-12-11 15:15:00
2095
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第五节流上的联接(二))
第五节则是第四节更加广泛的应用-联接,讲述了四种联接以及表函数的应用。
2025-12-11 13:30:00
602
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第五节流上的联接(一))
第五节则是第四节更加广泛的应用-联接,讲述了四种联接以及表函数的应用。
2025-12-11 10:15:00
578
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第四节SQL入门与查询(二))
第四节则介绍了SQL的入门及示例,按照DataStream的格式介绍源、实时查询和下沉相关的内容,以及一个SQL是如何工作的。
2025-12-10 14:45:00
624
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第四节SQL入门与查询(一))
第四节则介绍了SQL的入门及示例,按照DataStream的格式介绍源、实时查询和下沉相关的内容,以及一个SQL是如何工作的。
2025-12-10 10:15:00
625
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第三节Table API & SQL 的流式处理(三))
第三节则按照流式处理必须涉及的状态、动态表、时间属性以及时态表在Table API & SQL 是如何工作的,也即了解其为什么。
2025-12-09 14:45:00
710
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第三节Table API & SQL 的流式处理(二))
第三节则按照流式处理必须涉及的状态、动态表、时间属性以及时态表在Table API & SQL 是如何工作的,也即了解其为什么。
2025-12-09 10:15:00
680
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第三节Table API & SQL 的流式处理(一))
第三节则按照流式处理必须涉及的状态、动态表、时间属性以及时态表在Table API & SQL 是如何工作的,也即了解其为什么。
2025-12-08 14:45:00
910
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第二节Table API 与 DataStream API集成(一))
第一、二节讲述了Table API & SQL 的用法以及如何与DataStream API进行集成,该部分对于编程来说非常重要,也是使用Flink的基础。
2025-12-08 10:15:00
2365
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第二节Table API 与 DataStream API集成(二))
第一、二节讲述了Table API & SQL 的用法以及如何与DataStream API进行集成,该部分对于编程来说非常重要,也是使用Flink的基础。
2025-12-05 14:35:56
893
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第一节Table API& SQL编程指南(二))
第一、二节讲述了Table API & SQL 的用法以及如何与DataStream API进行集成,该部分对于编程来说非常重要,也是使用Flink的基础。
2025-12-05 14:02:31
875
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(整章)
介绍了Flink的三大基础核心技术之一的DataStream,其余的2个核心基础分别是Flink Table API & SQL和Connector。本章先从DataStream API编程指南开始,让读者对DataStream有一个直观的认识,比较系统的介绍了DataStream的使用过程及相关的内容。接下来就对DataStream API在处理流批应用的不同方式。再接下来的第三节就DataSource的原理进行了介绍,同时针对DataStream编程中的Source、transformation和sin
2025-12-05 10:15:00
1010
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第一节Table API& SQL编程指南(一))
第一、二节讲述了Table API & SQL 的用法以及如何与DataStream API进行集成,该部分对于编程来说非常重要,也是使用Flink的基础。
2025-12-05 10:15:00
883
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第五节管理执行与第六节本章小结)
第五节针对Flink的执行配置、打包和并行执行进行了说明。执行配置中针对Flink在编码阶段通过设置不同的参数进行说明和使用;打包则是实际开发中非常必要的过程,因为编码的结果最终都是放在Flink集群中运行的,所以该步骤是必须的;Flink的并行执行则是说明算子的并行度如何设置,良好的并行度配置往往决定了Flink的性能,需要特别注意。
2025-12-04 14:45:00
912
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第四节转换算子)
第四介绍了Flink的23种常用的转换算子、物理分区算子链和资源组以及名字和描述的内容,同时针对比较常用的给出了相应的示例,比如OutputTag和Process算子代替Split和Select示例。
2025-12-04 10:15:00
926
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第三节数据源(二))
第三节介绍了DataSource的相关内容,通过本节的介绍大致上能理解DataSource的实现过程及逻辑,为更深入的理解Flink source提供了较为坚实的基础。本节通过DataSource的原理、API、SplitReader API、事件时间和水印以及DataStream 连接器几个方面进行了说明。
2025-12-03 14:45:00
974
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第三节数据源(一))
第三节介绍了DataSource的相关内容,通过本节的介绍大致上能理解DataSource的实现过程及逻辑,为更深入的理解Flink source提供了较为坚实的基础。本节通过DataSource的原理、API、SplitReader API、事件时间和水印以及DataStream 连接器几个方面进行了说明。
2025-12-03 10:15:00
983
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第二节流批执行模式)
第二节介绍了流批的执行模式,旨在让读者了解Flink DataStream 是如何通过一套API解决实际的流批不同的应用场景问题。介绍了批执行模式的应用场景和配置方式、流批的执行行为和其不同之处。
2025-12-02 14:45:00
1023
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第一节DataStream API 编程指南(三))
第一节介绍了Flink DataStream API编程指南,该部分是使用Flink的基础。通过DataStream API程序剖析、DataSource、Transformation、Sink、Iteration、执行参数和调试几个角度进行介绍,并以一个示例展示其常见的使用方式。在完成本节的学习后,基本上能熟练的使用DataStream API,不同的是在该节的基础上了解更多的API的使用方式。
2025-12-02 10:15:00
1040
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第一节DataStream API 编程指南(二))
第一节介绍了Flink DataStream API编程指南,该部分是使用Flink的基础。通过DataStream API程序剖析、DataSource、Transformation、Sink、Iteration、执行参数和调试几个角度进行介绍,并以一个示例展示其常见的使用方式。在完成本节的学习后,基本上能熟练的使用DataStream API,不同的是在该节的基础上了解更多的API的使用方式。
2025-12-01 14:45:00
1072
原创 Flink原理与实战(java版)#第6章 Flink的 DataStream API(第一节DataStream API 编程指南(一))
第一节介绍了Flink DataStream API编程指南,该部分是使用Flink的基础。通过DataStream API程序剖析、DataSource、Transformation、Sink、Iteration、执行参数和调试几个角度进行介绍,并以一个示例展示其常见的使用方式。在完成本节的学习后,基本上能熟练的使用DataStream API,不同的是在该节的基础上了解更多的API的使用方式。
2025-12-01 10:15:00
2068
9、NIFI综合应用场景-通过NIFI配置kafka的数据同步
2023-05-29
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(二)
2023-05-29
5、NiFi FileFlow示例和NIFI模板示例
2023-05-29
1、nifi-1.9.2介绍、单机部署及简单验证
2023-05-29
2、HDFS操作 - shell客户端
2023-05-29
3、HDFS的使用(读写、上传、下载、遍历、查找文件、整个目录拷贝、只拷贝文件、列出文件夹下文件、删除文件及目录、获取文件及文件
2023-05-29
6、NIFI应用场景-离线同步Mysql数据到HDFS中
2023-05-29
1、hadoop3.1.4简单介绍及部署、简单验证
2023-05-29
8、NIFI综合应用场景-NiFi监控MySQL binlog进行实时同步到hive
2023-05-29
7、NIFI综合应用场景-将mysql查询出的json数据转换成txt后存储至HDFS中
2023-05-29
2、NIFI应用示例-GetFile和PutFile应用
2023-05-29
3、kafka重要概念介紹及示例
2023-05-29
5、kafka监控工具Kafka-Eagle介绍及使用
2023-05-29
4、kafka分区、副本介绍及示例、高级API与低级API
2023-05-29
1、kafka(2.12-3.0.0)介绍、部署及验证、基准测试
2023-05-29
2、java调用kafka api
2023-05-29
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(一)
2023-05-29
5、zookeeper的java -Curator(服务注册与发现)
2023-05-29
4、NIFI集群部署及验证
2023-05-29
3、NIFI处理器介绍、FlowFlie常见属性、模板介绍和运行情况信息查看
2023-05-29
12、HDFS Trash垃圾桶回收介绍与示例
2023-05-29
22、MapReduce使用Gzip压缩、Snappy压缩和Lzo压缩算法写文件和读取相应的文件
2023-05-29
23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化
2023-05-29
21、MapReduce读写SequenceFile、MapFile、ORCFile和ParquetFile文件
2023-05-29
19、Join操作map side join 和 reduce side join
2023-05-29
7、大数据中常见的文件存储格式以及hadoop中支持的压缩算法
2023-05-29
18、MapReduce的计数器与通过MapReduce读取-写入数据库示例
2023-05-29
20、MapReduce 工作流介绍
2023-05-29
16、MapReduce的基本用法示例-自定义序列化、排序、分区、分组和topN
2023-05-29
17、MapReduce的分区Partition介绍
2023-05-29
15、MapReduce介绍及wordcount
2023-05-29
13、HDFS Snapshot快照
2023-05-29
11、hadoop环境下的Sequence File的读写与合并
2023-05-29
10、HDFS小文件解决方案-Archive
2023-05-29
9、hadoop高可用HA集群部署及三种方式验证
2023-05-29
8、HDFS内存存储策略支持和“冷热温”存储
2023-05-29
4、HDFS-java操作类HDFSUtil及junit测试(HDFS的常见操作以及HA环境的配置)
2023-05-29
14、HDFS 透明加密KMS
2023-05-29
6、HDFS的HttpFS-代理服务
2023-05-29
5、HDFS API的RESTful风格-WebHDFS
2023-05-29
8、Elasticsearch7.6.1收集mysql慢查询日志及监控
2023-07-03
7、Elasticsearch7.6.1收集nginx日志及监测指标示例
2023-07-03
1、介绍lucene的功能以及建立索引、搜索单词、搜索词语和搜索句子四个示例实现
2023-07-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅