- 博客(441)
- 收藏
- 关注
原创 Flink原理与实战(java版)#第11章Flink的应用(整章)
分别介绍了Flink的CDC及与Flink集成、通过Flink CDC将MySQL数据实时同步到Elasticsearch和Table API & SQL的外部连接器Hive的应用。
2026-01-05 10:15:00
858
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(九))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2026-01-04 14:30:00
813
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(八))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2026-01-04 10:15:00
784
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(七))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-31 14:45:00
999
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(六))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-31 10:15:00
988
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(五))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-30 14:45:00
1032
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(四))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-30 10:15:00
1039
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(三))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-29 14:00:00
1107
2
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(二))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-29 10:15:00
2449
原创 Flink原理与实战(java版)#第11章Flink的应用(第三节Table & SQL 连接器之Hive(一))
介绍Hive作为Table API和SQL的外部连接器使用,并且结合实际应用中会使用kafka作为数据源进行介绍。
2025-12-26 15:30:00
1244
原创 Flink原理与实战(java版)#第11章Flink的应用(第二节通过Flink CDC将MySQL的user表数据同步至Elasticsearch表(二))
介绍了通过Flink CDC 实现将MySQL的数据实时同步到Elasticsearch中,然后进行验证数据库的添加、删除和修改相关功能,实际应用过程中如果有计算则可在将数据同步至Elasticsearch前实现。
2025-12-26 13:30:00
1315
原创 Flink原理与实战(java版)#第11章Flink的应用(第二节通过Flink CDC将MySQL的user表数据同步至Elasticsearch表(一))
介绍了通过Flink CDC 实现将MySQL的数据实时同步到Elasticsearch中,然后进行验证数据库的添加、删除和修改相关功能,实际应用过程中如果有计算则可在将数据同步至Elasticsearch前实现。
2025-12-26 10:15:00
1245
原创 Flink原理与实战(java版)#第11章Flink的应用(第一节Flink的CDC)
介绍了Flink 的CDC架构、与Flink的版本关系、特性和分别集成Flink SQL Cli和DataStream API,并分别通过例子介绍了如何集成。实际上Flink CDC的工具也有很多,比如maxwell、Debezium、canal、ogg等,支持的数据库也有很多,比如常见的MySQL、Oracle、PostgreSQL等。
2025-12-25 15:30:00
1327
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(整章)
介绍了Flink的一个应用分支,即复杂时间匹配(CEP),其是作为一个类库的形式提供的。实现CEP分为三步,即定义模式、将模式映射到流上,然后从流中选取数据即可 ,一般也叫编程模型。模式可以分为单个模式、组合模式和模式组,同时还可以针对模式定义其跳过策略。将模式映射到流上比较简单,就是将定义的模式和需要检测的流进行关联。选取流则是流上的数据和模式匹配的结果,同时,也可以根据时间属性处理延迟或超时的数据。同时也介绍了CEP的时间、可选参数以及版本迁移,最后以三个可能有一定实际应用场景的示例作为结尾。
2025-12-25 13:30:00
1528
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第四节CEP库中的时间和第五节本章小结)
简单的介绍了CEP库的时间处理和可选的参数有哪些以及旧版本如何升级。
2025-12-25 10:15:00
1275
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第三节检测模式(二))
介绍了检测模式,就是将定义好的模式映射到流上以及从映射后的流上提取数据结果。匹配事件的选择提取不管是PatternSelectFunction还是PatternFlatSelectFunction都可以用,但官方推荐的提取方式是PattrnProcessFunction,因为其在提取的时候还可以通过processMatch()结合上下文进行数据处理。在该节也介绍了针对流上的超时数据如何处理,和其他的流处理方式一样,也就是通过PatternProcessFunction或PatternTimeoutFunct
2025-12-24 14:45:00
1675
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第三节检测模式(一))
介绍了检测模式,就是将定义好的模式映射到流上以及从映射后的流上提取数据结果。匹配事件的选择提取不管是PatternSelectFunction还是PatternFlatSelectFunction都可以用,但官方推荐的提取方式是PattrnProcessFunction,因为其在提取的时候还可以通过processMatch()结合上下文进行数据处理。在该节也介绍了针对流上的超时数据如何处理,和其他的流处理方式一样,也就是通过PatternProcessFunction或PatternTimeoutFunct
2025-12-24 10:15:00
1340
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第二节模式API(三))
针对CEP的模式API进行了详细介绍,并针对每个模式API都给出了具体的应用示例。一般而言,单个模式或组合模式与跳过策略一起使用能满足很多常见的场景,模式组只有在一些比较特殊的场景中使用较多。
2025-12-23 14:45:00
1368
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第二节模式API(二))
针对CEP的模式API进行了详细介绍,并针对每个模式API都给出了具体的应用示例。一般而言,单个模式或组合模式与跳过策略一起使用能满足很多常见的场景,模式组只有在一些比较特殊的场景中使用较多。
2025-12-23 10:15:00
1380
原创 Flink原理与实战(java版)#第10章 Flink的 CEP(第一节Flink CEP介绍和第二节模式API(一))
通过入门示例让读者感受一下CEP,接下来就介绍了其编程模型。
2025-12-22 14:45:00
1418
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(整章)
分为2个部分介绍了Flink的监控与优化,即Flink提供了哪些指标以及如何监控和Flink优化的方向有哪些及怎么优化。
2025-12-22 10:15:00
2784
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第七节流式聚合调优及第八节本章小结)
介绍了Flink在聚合时的优化,主要是从聚合时的状态查询、数据倾斜以及distinct的拆分几个方面进行说明。Flink在进行聚合时需要读取状态信息(累加器)、修改和写回累加器,该操作会增加状态后端的开销,启用MiniBatch聚合可以将聚合算子存储在缓冲区中,当然该种方式可能会有一定的延迟发生,需要进行吞吐量与延迟做好平衡。本地聚合则是解决数据倾斜的情况,启动本地聚合可以实现先上游本地聚合再下游全局聚合,其依赖与已经启用来MiniBatch聚合。拆分distinct则是通过两级聚合完成distinct
2025-12-21 15:30:00
1475
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第六节网络缓冲调优)
从网络方面给出了如何进行优化,比如网络的缓冲消胀机制、网络缓冲的生命周期和缓冲区的数量等知识介绍的同时如何进行优化。网络缓冲消胀机制如何配置和可能获得结果以及使用限制场景;网络缓冲的生命周期则是从输入和输出网络两个方面进行介绍;缓冲区的数量则是介绍了Flink本身默认值是多少,其默认值一般来说不需要修改就足以应对一般的业务场景。
2025-12-21 10:15:00
1477
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第三节监控反压、第四节内存调优及第五节大状态与检查点调优)
介绍了Flink作为一个实时计算框架不可避免会遇到的事情-反压,其如何进行监控、如何界定是否出现了反压等相关内容。并通过一个示例介绍了Flink是如何来标明反压状态的。
2025-12-19 15:30:00
1563
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第二节示例:Flink 的指标报告)
介绍了Flink作为一个实时计算框架不可避免会遇到的事情-反压,其如何进行监控、如何界定是否出现了反压等相关内容。并通过一个示例介绍了Flink是如何来标明反压状态的。
2025-12-19 13:45:00
1567
原创 Flink原理与实战(java版)#第9章 Flink的监控与优化(第一节Flink 指标体系)
介绍了Flink的指标体系,其中包含指标的注册、范围、报告生成、系统指标有哪些、端到端的延迟跟踪、状态访问延迟跟踪和指标体系通过Restful API 和Dashboard的集成内容。第二节则是第一节的延续,是针对将Flink的指标与外部系统的集成,介绍了如何进行集成,并介绍了哪些软件可以和Flink直接进行集成,并以与JMX集成作为示例进行说明,目前比较流行的可能是与Prometheus的集成,至于如何应用则以实际的应用环境为准。
2025-12-19 10:15:00
1576
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(整章)
分别从DataStream 和 Table API & SQL两个方面介绍外部连接器的支持与使用情况,为了更加贴近我们实际生产应用和系统应用,不管是DataStream的外部连接器还是Table API & SQL 的外部连接器本书都是选取的Kafka作为重点介绍的内容。当然结合当前行业的市场存量情况,Flink与Hadoop、Hive的结合应用也较为常见,本章以HDFS为应用基础介绍了文件系统。
2025-12-18 15:30:00
1748
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(三)及第三节本章小结)
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-18 13:45:00
1712
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(二))
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-18 10:15:00
1636
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第二节Table API & SQL连接器之Kafka(一))
第二节介绍了Table API & SQL 的Connector外部连接器支持情况、支持的数据格式以及外部连接器kafka内容。详细地讲解了如何在Flink SQL Client创建Kafka表、有哪些元数据可以使用、连接器有哪些参数可以设置,当然更深入的介绍了kafka作为Flink Table API & SQL 的外部连接器有哪些特性等内容。在介绍的同时,便于读者进行理解和应用,文章内辅以大量可直接运行的示例。但针对常用的数据格式(csv、json、parquet和orc等)则没有介绍,同时针对外部连
2025-12-17 14:45:00
1665
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第一节DataStream 连接器之Kafka(二))
第一节介绍了DataStream的Connector的内容。该节介绍了Flink外部连接器容错保证和重要的一个外部连接器kafka。Flink 的外部连接器kafka在使用的时候会有哪些困惑?本小节从怎么引入、kafka作为source和sink的使用方式以及示例进行说明、kafka作为外部连接器的版本变化、kafka在运行过程中的监控、安全、版本升级等,甚至包括使用过程中出现了异常如何解决等。
2025-12-17 10:15:00
1670
原创 Flink原理与实战(java版)#第8章 Flink的 Connectors(第一节DataStream 连接器之Kafka(一))
第一节介绍了DataStream的Connector的内容。该节介绍了Flink外部连接器容错保证和重要的一个外部连接器kafka。Flink 的外部连接器kafka在使用的时候会有哪些困惑?本小节从怎么引入、kafka作为source和sink的使用方式以及示例进行说明、kafka作为外部连接器的版本变化、kafka在运行过程中的监控、安全、版本升级等,甚至包括使用过程中出现了异常如何解决等。
2025-12-16 14:45:00
1712
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(整章)
本章简略的介绍了Flink Table API & SQL 的内容,其中内容是Flink的核心功能之一,与DataStream API、Connector连接器是非常核心功能,其中Table API & SQL 较其他两者更为重要。其中非常重要的时区、SQL Cli、SQL Gateway、模块以及Table API等相关内容本书没有介绍或介绍极其简略,同时也缺乏相对的示例,特别是Table API与DataStream API的集成相关内容。
2025-12-16 10:15:00
2866
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第八节Catalogs(二)及本章小结)
本节介绍了catalogs的分类以及Flink的表如何注册到catalog中
2025-12-15 14:45:00
1997
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第八节Catalogs(一))
本节介绍了catalogs的分类以及Flink的表如何注册到catalog中
2025-12-15 10:15:00
1909
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第七节函数(二))
本节介绍了Flink的系统内置函数与自定义函数的开发过程及示例
2025-12-12 15:30:00
1914
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第七节函数(一))
本节介绍了Flink的系统内置函数与自定义函数的开发过程及示例
2025-12-12 13:30:00
1902
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第六节窗口(二))
第六节讲述了Flink非常重要的应用-窗口的应用,介绍了滑动、滚动和累积窗口,并介绍了窗口的聚合,同时讲述了Top-N和窗口的Top-N,以详细的示例进行说明。
2025-12-12 10:15:00
1918
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第六节窗口(一))
第六节讲述了Flink非常重要的应用-窗口的应用,介绍了滑动、滚动和累积窗口,并介绍了窗口的聚合,同时讲述了Top-N和窗口的Top-N,以详细的示例进行说明。
2025-12-11 15:15:00
3458
原创 Flink原理与实战(java版)#第7章 Flink的 Table API & SQL(第五节流上的联接(二))
第五节则是第四节更加广泛的应用-联接,讲述了四种联接以及表函数的应用。
2025-12-11 13:30:00
1997
9、NIFI综合应用场景-通过NIFI配置kafka的数据同步
2023-05-29
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(二)
2023-05-29
5、NiFi FileFlow示例和NIFI模板示例
2023-05-29
1、nifi-1.9.2介绍、单机部署及简单验证
2023-05-29
2、HDFS操作 - shell客户端
2023-05-29
3、HDFS的使用(读写、上传、下载、遍历、查找文件、整个目录拷贝、只拷贝文件、列出文件夹下文件、删除文件及目录、获取文件及文件
2023-05-29
6、NIFI应用场景-离线同步Mysql数据到HDFS中
2023-05-29
1、hadoop3.1.4简单介绍及部署、简单验证
2023-05-29
8、NIFI综合应用场景-NiFi监控MySQL binlog进行实时同步到hive
2023-05-29
7、NIFI综合应用场景-将mysql查询出的json数据转换成txt后存储至HDFS中
2023-05-29
2、NIFI应用示例-GetFile和PutFile应用
2023-05-29
3、kafka重要概念介紹及示例
2023-05-29
5、kafka监控工具Kafka-Eagle介绍及使用
2023-05-29
4、kafka分区、副本介绍及示例、高级API与低级API
2023-05-29
1、kafka(2.12-3.0.0)介绍、部署及验证、基准测试
2023-05-29
2、java调用kafka api
2023-05-29
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(一)
2023-05-29
5、zookeeper的java -Curator(服务注册与发现)
2023-05-29
4、NIFI集群部署及验证
2023-05-29
3、NIFI处理器介绍、FlowFlie常见属性、模板介绍和运行情况信息查看
2023-05-29
12、HDFS Trash垃圾桶回收介绍与示例
2023-05-29
22、MapReduce使用Gzip压缩、Snappy压缩和Lzo压缩算法写文件和读取相应的文件
2023-05-29
23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化
2023-05-29
21、MapReduce读写SequenceFile、MapFile、ORCFile和ParquetFile文件
2023-05-29
19、Join操作map side join 和 reduce side join
2023-05-29
7、大数据中常见的文件存储格式以及hadoop中支持的压缩算法
2023-05-29
18、MapReduce的计数器与通过MapReduce读取-写入数据库示例
2023-05-29
20、MapReduce 工作流介绍
2023-05-29
16、MapReduce的基本用法示例-自定义序列化、排序、分区、分组和topN
2023-05-29
17、MapReduce的分区Partition介绍
2023-05-29
15、MapReduce介绍及wordcount
2023-05-29
13、HDFS Snapshot快照
2023-05-29
11、hadoop环境下的Sequence File的读写与合并
2023-05-29
10、HDFS小文件解决方案-Archive
2023-05-29
9、hadoop高可用HA集群部署及三种方式验证
2023-05-29
8、HDFS内存存储策略支持和“冷热温”存储
2023-05-29
4、HDFS-java操作类HDFSUtil及junit测试(HDFS的常见操作以及HA环境的配置)
2023-05-29
14、HDFS 透明加密KMS
2023-05-29
6、HDFS的HttpFS-代理服务
2023-05-29
5、HDFS API的RESTful风格-WebHDFS
2023-05-29
8、Elasticsearch7.6.1收集mysql慢查询日志及监控
2023-07-03
7、Elasticsearch7.6.1收集nginx日志及监测指标示例
2023-07-03
1、介绍lucene的功能以及建立索引、搜索单词、搜索词语和搜索句子四个示例实现
2023-07-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅