HDFS开启审计日志
2024-10-16 10:38:33
508
1
Trino On K8S(Dockerfile)[建议]
2024-05-26 10:43:42
468
反编译 Trino Dockerfile
2024-05-21 13:07:56
517
Trino On K8S (DockerHub)
2024-05-15 17:36:03
539
Kube-prometheus Deploy Prometheus
2024-05-14 19:19:29
305
Rancher Deployment (Helm)
2024-05-08 20:41:33
447
Ingress-nginx Deployment (Helm)
2024-04-17 14:43:10
455
Harbor Deployment (Helm)
2024-04-15 15:01:06
342
Harbor Deployment (Docker-compose)
2024-04-09 11:30:00
287
K8S Deployment HA
2024-04-08 10:36:34
879
Python3 优雅上下线YARN NM节点
2024-01-23 14:44:17
218
unable to create new native thread 问题处理
2024-01-17 19:51:37
4131
1
Hadoop YARN CGroup 生产实践
2023-12-28 11:11:12
1485
Spark调度系统流程
2023-09-10 22:03:15
396
Coordinator协调器:用于接受用户查询并管理工作节点以执行查询工作。Worker工作节点:负责执行任务和处理数据。协调器上通常会运行一个节点发现服务(discovery service),工作节点通过注册到此服务以加入集群。客户端、协调器和工作节点之间的通信和数据传输完全通过基于 HTTP/HTTPS 的 RESTful API 调用。
2023-08-22 22:58:02
475
Unable to register with external shuffle server due to Failed to connect to xxx7337
2023-08-15 22:27:01
738
StarRocks集群部署
2023-04-10 09:47:48
916
1
Structured Streaming简介
2023-03-21 11:04:28
990
数据库查询引擎执行模型
2023-03-14 16:01:16
1060
Linux系统中负载高问题排查思路与解决方法
2023-03-07 09:21:12
4958
Spark 内存管理
2023-03-06 19:27:53
701
Spark3 新特性之DPP
2023-03-03 14:30:35
1125
Spark3 新特性之AQE
2023-02-24 10:11:44
3690
Spark RDD及内存计算
2023-02-21 11:08:39
477
Spark on hive & Hive on spark
2023-02-15 10:50:42
833
DataFrame与Spark SQL的由来
2023-02-09 17:13:52
378
使用Kube-prometheus部署Prometheus (K8S)
2022-11-03 17:11:57
711
HBase读写流程及Coprocessor
2022-07-04 12:04:07
431
HBase Bulk Load 批量导数
2022-06-14 12:13:42
267
HBase调优-操作系统调优
2022-06-09 09:32:27
1054
HBase RegionServer介绍 HLog、MemStore、BlockCache
2022-05-17 20:48:48
1266
二、HBase的核心数据结构 跳跃表、LSM树、布隆过滤器
2022-04-29 12:01:19
2645
一、Hbase介绍、数据模型、体系结构
2022-04-24 21:00:00
6264
Grafana页面嵌入及隐藏左侧边栏和顶部菜单栏
2022-04-14 20:00:00
6724
Pyspark on Yarn解决pythony依赖问题
2022-04-08 20:00:00
3092
Kudu参数优化及使用限制
2022-04-02 19:30:00
1516
ansible使用用户密码远程执行命令
2022-03-23 21:15:00
6547
文章目录Chandy-Lamport分布式快照算法Distributed SnapshotThe Chandy-Lamport AlgorithmExampleChandy-Lamport分布式快照算法Distributed Snapshot分布式快照:特定时间点记录下来的分布式系统的全局状态(global state)。分布式快照主要用途:故障恢复(即检查点)、死锁检测、垃圾收集等。将分布式系统抽象为一张有向图:顶点称为进程(process),边称为channel。下图就示出包含3个进程和4个c
2022-01-26 21:00:00
2191
Flink学习安装部署、任务提交
2020-07-09 16:51:54
715
1
PySpark读取Hive、写入Mysql、集成Kafka
2020-06-24 14:02:15
582