自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(385)
  • 收藏
  • 关注

原创 虚拟机能 ping 通宿主机,但宿主机 ping 不通虚拟机

window11 VMware 虚拟机。

2026-04-25 22:30:11 57

原创 docker mysqld: Can‘t create/write to file ‘/tmp/ibOrYaxI‘ (OS errno 13 - Permission denied)

mysql 容器恢复启动异常。新指定挂载空临时目录文件。

2026-04-20 16:39:37 21

原创 You can‘t specify target table ‘xxx‘ for update in FROM clause

因为在 DELETE 语句的子查询中直接引用了要删除的同一张表,MySQL 不允许这种操作。

2026-04-14 10:52:07 19

原创 dolphinscheduler 定时任务未调度

工作流运行未生产工作流实例。

2026-03-28 10:18:23 39

原创 计算机正数 / 负数及位运算

正数表示:5,正数在计算机中以原码存在负数表示:-5,

2026-03-13 22:45:57 31

原创 dolphinscheduler 网卡

【代码】dolphinscheduler 网卡。

2026-03-09 10:51:08 30

原创 “specify container image platform“ requires API version 1.41, but the Docker daemon API version is 1

【代码】“specify container image platform“ requires API version 1.41, but the Docker daemon API version is 1。

2026-02-10 17:41:09 48

原创 同步异常: Incorrect datetime value: ‘1970-01-01 00:00:00‘ for column ‘xxxx‘

【代码】Data truncation: Incorrect datetime value: ‘1970-01-01 00:00:00‘ for column ‘first_recharge_time‘

2026-01-23 18:31:57 574

原创 window java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$POSIX

spark window 本地任务异常

2026-01-08 11:48:34 86

原创 FlinkCDC 数据倾斜

flinkcdc 数据倾斜

2025-12-25 15:13:24 41

原创 脚本外部调用 shell 脚本内部定义的 function

【代码】脚本外部调用 shell 脚本内部定义的 function。

2025-12-12 14:52:15 129

原创 Paimon changelog-producer 与 merge-engine

Paimon表的changelog-producer用于生成数据变更日志,支持四种模式:None、Input、Lookup和full-compaction。None模式不存储额外数据,适用于批处理场景;Input模式直接传递输入消息,适合数据库binlog场景;Lookup模式查找旧值生成完整变更日志,适合有计算逻辑的表;full-compaction模式在完全合并文件时生成变更日志,代价较高。不同模式根据业务需求选择,以平衡时效性和资源开销。

2025-11-04 12:14:33 414

原创 dolphinscheduler 依赖节点不通过

dolphinscheduler 节点依赖,某个依赖报依赖不通过。master、worker、 api 程序执行添加。但 ds 所在的服务器时间是正确的。

2025-08-13 14:42:05 271

原创 Apache Ranger 权限管理

【代码】Apache Ranger 权限管理。

2025-07-25 17:38:29 534

原创 DWS层新增指标处理方案

业务逻辑确认: 与业务方或需求方深入沟通,清晰定义新指标的计算公式、统计口径(维度、粒度)、业务含义、是否允许为空、默认值是什么。数据来源确认: 确定计算该指标所需的最细粒度数据来源:是否完全依赖现有 DWS 层数据即可计算?(最理想情况,影响最小)是否需要依赖 DWD (Data Warehouse Detail) 层的明细数据?(需要向下追溯)是否需要依赖 ODS (Operational Data Store) 层或其他外部数据源?(影响较大,需评估数据质量和接入)历史数据要求。

2025-06-12 18:11:31 881

转载 LD_LIBRARY_PATH

【代码】LD_LIBRARY_PATH。

2025-06-02 21:09:00 225

原创 记一次 Starrocks be 内存异常宕机

突发性 be 内存飙高,直至被系统 kill 掉,be 内存如下:其中指标打满,重启也是如此看到被 kill 了每次重启 be 都会去拉起 tablet: 3544744及。

2025-05-29 16:20:53 1261

原创 StarRocks 异常 Table creation timed out.

【代码】StarRocks 异常 Table creation timed out.

2025-04-22 16:16:48 321

原创 StarRocks 事务

starrocks 事务

2025-03-20 11:57:17 535

原创 SparkSQL query optimization

Spark, in recent years, has become the go-to distributed computation framework for a lot of different use cases. From only providing map-reduce funtionalities, it has introduced other modules: from machine learning, to graph data, to SQL.Today we will focu

2025-03-02 17:56:54 1225

转载 揭露数据不一致的利器 —— 实时核对系统

随着企业业务发展,以及微服务化大趋势下单体服务的拆分,服务间的通信交互越来越多。与单体服务不同,微服务间的数据往往需要通过额外的手段来保障一致性,例如事务消息、异步任务补偿等。除了从机制上最大程度保障以外,如何观测并及时发现数据不一致也非常重要。本文介绍 Shopee Financial Products 团队设计和开发的实时核对系统(Real-time Checking System)

2025-03-02 11:02:17 379

原创 Spark Tuning -- explaining Spark SQL Join Types

Spark join type

2025-02-25 03:29:34 1308

原创 Dolphinscheduler 参数传递

参数传递

2025-02-10 18:28:03 1091

翻译 Rapidly Changing Dimension (RCD) in Data Warehouse 杂项维度

杂项维度

2025-01-07 11:29:13 152

原创 企业微信——智能表格学习

企业微信报表

2025-01-03 14:04:27 9246

原创 Spark Optimization —— Reducing Shuffle

randomness。

2024-12-01 22:48:50 1449

原创 Apache Gravitino 元数据管理

元数据管理

2024-11-06 00:44:24 1738

转载 用户商品推荐

商品推荐

2024-10-23 11:46:47 348

原创 StarRocks FE启动异常

服务器断电,StarRocks FE 启动失败。

2024-10-22 20:07:04 1053 2

原创 Starrocks 元数据恢复 failed to load journal type 10242

Starrocks 元数据恢复

2024-10-08 14:29:19 756

原创 Starrocks with 嵌套

在某些场景下需要进行 with 嵌套

2024-09-27 17:26:22 848

翻译 Recommender System using ALS in Pyspark

【代码】Recommender System using ALS in Pyspark。

2024-09-12 01:59:19 283

原创 Apifox 接口中文报 Request path contains unescaped characters

2024-08-29 18:48:13 349

原创 数值治理学习记录

数据治理

2024-07-02 17:29:47 258

转载 详解数据治理体系

数据治理

2024-07-02 15:37:06 222

翻译 How to develop an enterprise data warehouse from scratch to foster a data-driven culture

data warehouse

2024-06-21 17:16:36 239

原创 hive SQL264 牛客每个人最近的登录日期(五)

hive sql

2024-06-20 11:07:09 476

原创 hive on spark 记录

hive on spark 记录。

2024-06-17 15:05:23 724

原创 TPCH 导入Starrocks

【代码】TPCH 导入Starrocks。

2024-04-26 21:33:58 193

原创 Stargo 管理部署 Starrocks 集群

Stargo

2024-03-16 13:17:50 947

DQO 数据质量电子书、

DQO 数据质量电子书、

2025-03-25

hive 优化策略、、、、

hive 优化策略、、、、

2024-12-03

数据质量管理:6个维度,50个检查项

数据质量管理:6个维度,50个检查项

2024-11-05

个人Linux学习笔记

个人Linux学习笔记

2024-10-20

Developing High Quality Data Models

Developing High Quality Data Models

2023-10-18

CDH 集群安装文档参考

CDH 集群安装文档参考

2023-08-30

Flink Atlas 整合

Flink Atlas 整合

2022-09-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除