- 博客(5)
- 收藏
- 关注
原创 上手 Apache Fluss:环境部署、建表读写全流程指南
Fluss(读作 “弗卢斯”)是 Apache 孵化器中的「面向实时分析的列式流存储」,由阿里 Flink 团队开源,全称 FLink Unified Streaming Storage,专为和 Flink 深度集成、构建秒级实时数仓 / 湖仓而设计。Kafka:消息队列,侧重 “数据流转发”,不支持更新、分析弱。Paimon:流批一体湖格式,侧重 “历史 + 近实时存储”,分钟级延迟。
2026-06-07 21:08:38
1010
原创 Cloud Code 云原生开发实战:从本地构建到云端一键部署
Kubernetes(常简称为 K8s)是一个开源的容器编排平台,用于自动化容器化应用程序的部署、扩展、管理和运维。它由 Google 设计并捐赠给 Cloud Native Computing Foundation (CNCF),现已成为云原生应用的标准基础设施。Kubernetes 的核心目标是简化容器集群的管理,提供高可用性、自我修复和弹性伸缩能力。其主要功能包括:自动化部署和扩展:根据负载自动调整应用实例数量。服务发现和负载均衡:通过 Service 抽象实现内部通信和流量分发。
2026-04-11 13:55:45
2359
3
原创 突破 Linux 软件下载壁垒:阿里云镜像源配置(附完整备份与生效步骤
配置好后就可以下载自己所需要的系统软件、依赖包、工具等。2. 下载阿里云 CentOS 7 专用镜像源。1. 备份原来的源(防止搞坏)
2026-04-08 18:57:33
220
原创 Hadoop 高可用(HA)集群部署指南 —— 基于 ZooKeeper 的 NN 与 RM 双高可用实现
第六步:修改配置文件,其中core-site.xml必须配:fs.defaultFS:集群名、ha.zookeeper.quorum:ZK 地址、临时目录、回收站。最后对服务进行启动和格式化。第一步:检查mapred-site.xml ,里面只有yarn配置和historyServer的配置,不需要修改。其中必须要配置的包括:开启 ResourceManager HA、集群 ID、RM 节点 ID(g1、g2)、两台 RM 所在主机名、ZK 地址、开启任务恢复、状态存储类(ZKRMStateStore)。
2026-04-08 18:44:29
229
原创 分布式系统中枢:ZooKeeper 原理、选举与应用
Zookeeper是分布式系统中重要的协调服务,主要用于集群管理、状态监控和分布式一致性。它具有以下特点:1) 存储容量小但功能强大,支持Hadoop、Kafka等大数据组件;2) 提供服务器状态监控能力;3) 支持基础操作命令如create、get、watch等;4) 事务具有原子性;5) 采用Leader-Follower架构,通过epoch、zxid、myid三个参数进行选举,其中epoch表示选举次数,zxid反映事务次数,myid是机器标识。Zookeeper安装使用便捷,是分布式系统的重要基础设
2026-04-07 19:51:16
313
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅