自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

csdn问鼎

大数据初学者

  • 博客(412)
  • 资源 (14)
  • 问答 (1)
  • 收藏
  • 关注

原创 记录一次排查Flink一直重启的问题

Flink程序陷入重启死循环问题分析及解决过程。最初表现为任务持续重启失败,日志显示卡在RocksDB关闭操作。尝试调整pekko超时参数无效,怀疑与RocksDB相关但未果。临时解决方案是禁用checkpoint并添加重启策略。最终通过异常页面发现每天0点定时报错,与生产环境数据缺失时间吻合。反思指出两个关键失误:未准确记录事故时间点,以及未用Five Whys方法深挖重启根源。问题实际由0点的参数异常引起,修复后恢复正常。该案例凸显了现象记录和根本原因分析的重要性。

2026-02-07 10:37:09 326

原创 clickhouse 物化视图数据查询不稳定分析

分析物化view可能失效的原因

2025-12-19 23:07:05 484

原创 Flink 使用 RocksDB 作为状态后端存储的原因详解

RocksDB 作为 Flink 的状态后端,凭借其大容量支持、增量检查点、堆外存储、高性能 I/O等优势,成为生产环境中处理大状态流作业的首选方案。尽管其访问延迟略高于纯内存方案,但在状态规模、容错能力和资源效率方面具有不可替代的优势。合理配置 RocksDB(内存、磁盘、增量检查点)可显著提升 Flink 作业的稳定性与性能。

2025-10-23 22:41:01 1127

原创 Flink 水印(Watermark)最佳实践指南

Watermark= 当前已处理数据最大事件时间 - 允许的延迟时间作用:告诉Flink "从这个时间点之后的数据都已到达,可以安全触发窗口计算"核心公式"分流先行,水印后置"text源数据↓ 无水印分流(filter)↓ 独立水印窗口计算。

2025-10-23 21:36:41 776

原创 如何正确理解flink 消费kafka时的watermark

摘要:文章分析了Flink中watermark生成的三种场景:1)在source层全量数据生成watermark会导致不同业务流互相污染(如order和click事件);2)通过先filter分流再独立生成watermark可解决污染问题;3)rebalance操作会破坏per-partition watermark的单调递增性,导致watermark不准确。核心结论:watermark生成应尽量靠近数据源且保持分区特性,针对不同业务流需独立处理。(149字)

2025-10-22 22:53:41 432

原创 千字长文分析离奇metaspace oom问题

如何一步步分析离奇Metaspace OOM问题

2025-08-12 23:18:02 422

原创 es 里的Filesystem Cache 理解

主要理解filesystem cache 在es中的应用

2025-05-08 23:30:54 980

原创 记录seatunnel排查重复数据的案例分析

排查kafka 端到端一致性问题

2025-04-21 23:23:30 623

原创 flink jobmanager离奇的heap oom

通过层层分析找出导致flink jobmanager heap oom 内存的记录

2025-04-17 00:51:55 891

原创 flink 增量快照同步文件引用关系和恢复分析

主要介绍flink 理解增量快照 中的一些问题

2025-04-07 23:10:55 1119 1

原创 记录clickhouse记录一次性能优化,从60s到1s

以实例例子演示clickhouse 常用优化手段

2025-04-06 22:35:41 575

原创 clickhouse 查询优化思路

介绍clickhouse 优化方案

2024-12-16 22:14:40 820

原创 clickhouse 使用global in 优化 in查询

理解global in 实现原理

2024-11-26 21:24:45 771

原创 理解clickhouse 里的分区和分片键区别

分区和分片键区别

2024-11-25 23:27:58 618

原创 clickhouse 分片键的重要性

理解分片键在CK表的重要性

2024-11-24 22:50:37 375

原创 理解mybatis 里的mapper 实现原理

理解mapper 实现原理

2024-11-16 22:45:21 451

原创 flink StreamGraph 构造flink任务

手工生成flink 作业有向无环图

2024-11-13 22:42:09 652

原创 geohash 函数缩放导致坐标点漂移问题

GIS 地图聚合相关

2024-11-09 20:46:38 483

原创 大数据计算里的-Runtime Filter

解释运行时过滤的原理

2024-11-03 18:03:29 412 1

原创 大数据计算里的Broadcast Hash Join/Shuffle Hash Join/Sort Merge Join

大数据计算里三种JOIN实现

2024-10-31 23:33:51 418 1

原创 理解UUID 无序性对数据存储的影响

主要讲了会影响页分裂

2024-10-28 22:29:56 300

原创 flink cdc 原理解读

flink cdc 深入理解

2024-10-27 11:30:46 1027

原创 理解JVM里的栈信息

深入理解jvm里的栈

2024-10-16 22:44:39 1225

原创 理解calcite 里的Java CC

JAVA CC 在calcite 的应用

2024-10-11 21:54:56 551

原创 三层b+树估算存储多少行数据

估算三层b+tree 存储数据量

2024-10-10 22:17:44 459

原创 mysql 前缀索引

详细介绍前缀索引的使用场景

2024-10-08 22:23:41 375

原创 常见限流算法总结

总结限流算法

2024-10-08 21:29:46 498

原创 jvm里的metaspace oom 排查问题思路-使用MAT

分析metaspace oom 总量

2024-10-01 21:20:40 772

原创 一文理解mysql 联合索引和各种SQL语句分析

联合索引有两个rule要记一下,1.左到右,中间不能有skip,2.中间是range,后面不能用索引了联合索引的顺序非常重要,即使上面走了索引,也可能效果不好,正确的顺序是根据业务场景把最能区分的列放在前面,按照这样的顺序从左到右。

2024-09-28 22:18:47 505

原创 Flink 结合kafka 实现端到端的一致性原理

实战分析flink 和kafka 实现端到端一致性的各种case

2024-09-25 23:18:49 601

原创 一图快速看懂flink source的设计实现

整体来说多个处理流程是解偶的,这样可以在面对多数据源情况下,能更加的灵活。下面只展示了,主要的一些流程。

2024-09-21 21:50:35 355

原创 flink 为啥使用MemorySegment 来管理内存

flink 内存管理总量

2024-09-21 11:13:48 718

原创 一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

2024-09-15 22:17:33 985 1

原创 redis lua 介绍

介绍了redis lua 脚本语法,和使用场景。还有和spring 结合使用

2024-09-07 11:29:02 865

原创 flink窗口分组数据错乱

flink 窗口,大量迟到元素导致窗口错乱

2024-09-03 22:19:37 625

原创 Elasticsearch 里的父子文档插入和查询

实战es父子文档的使用

2024-09-02 22:56:42 608

原创 flink 实战理解watermark,maxOutOfOrderness,allowedLateness

【代码】flink 实战理解watermark,maxOutOfOrderness,allowedLateness。

2024-08-29 22:33:29 642

原创 大数据计算-SQL优化手段(CBO)-以Flink为例

展示CBO规则是如何在flink SQL里运行的

2024-08-26 22:40:15 717

原创 设计模式-visit模式-在语法树的实践

visit模式在解析语法树场景下的实践

2024-08-21 23:08:52 754

原创 场景分析-库存扣减

库存 扣减多种实现方案分析

2024-08-20 23:16:53 964

酒店管理系统源码,课程设计

酒店管理系统的完整代码。涉及到大量的java基础知识.特别适合java课程设计结课作业。

2016-05-02

kafka-manager-2.0.0.2.zip

最新版本kafka-manger源码编译,

2019-06-23

支付宝支付宝即时到账接口

支付宝即时到账,支持java php.

2016-07-04

第三方平台实现个人相册

借用第三方平台实现个人相册

2016-10-25

Hibernate 核心类库

hibernate-release-5.1.0.Final 的核心文件

2016-05-07

json包

使用json必须包

2016-12-28

javax.mail.jar

2016-06-25

spring+mybatis增删改查

spring+mybatis增删改查

2017-04-23

spring mvc jar包

spring mvc 开发jar包

2017-03-09

二维码jar包

快速生成二维码

2016-10-05

junit-4.8.1

Junit 测试jar包

2016-05-07

酒店管理系统

酒店管理系统的完整代码。涉及到大量的java基础知识.特别适合java课程设计结课作业。

2016-05-02

Hibernate 项目图片资料

Hibernate 项目图片资料

2016-05-07

commons-email-1.3.jar_mail.jar_activation.jar

commons-email-1.3.jar_mail.jar_activation.jar

2016-06-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除