大数据Kubernetes（简称K8s）：架构、应用与优化

最新推荐文章于 2025-01-16 17:53:33 发布

星川皆无恙

最新推荐文章于 2025-01-16 17:53:33 发布

阅读量1.3k

点赞数 45

分类专栏：大数据大数据系统运维 Docker 文章标签：大数据 kubernetes 架构云原生容器 k8s 运维开发

本文链接：https://blog.csdn.net/Myx74270512/article/details/139750799

版权

大数据同时被 3 个专栏收录

127 篇文章

订阅专栏

大数据系统运维

57 篇文章

订阅专栏

Docker

13 篇文章

订阅专栏

文章目录

大数据Kubernetes（简称K8s）：架构、应用与优化
一、介绍
二、K8s架构深入解析
三、容器编排和管理
四、网络和存储
五、安全和合规
六、高可用和灾难恢复
七、监控和日志

大数据Kubernetes（简称K8s）：架构、应用与优化

在这里插入图片描述

一、介绍

在这里插入图片描述

Kubernetes的历史和演进

Kubernetes（简称K8s）是一个开源的容器编排系统，用于自动化应用程序的部署、扩展和管理。它最初是由Google内部的Borg系统启发并设计的，于2014年作为开源项目首次亮相。

初始阶段

Kubernetes的诞生源于Google内部对大规模容器管理的需求。早在2014年之前，Google已经在其内部系统Borg上积累了大量关于容器编排和管理的经验。这些经验和技术最终孕育出Kubernetes。

发展阶段

随着云计算和微服务架构的兴起，Kubernetes迅速成为行业标准。它的设计哲学、可扩展性和社区支持是其成功的关键因素。2015年，Cloud Native Computing Foundation（CNCF）成立，并接管了Kubernetes的发展。在CNCF的支持下，Kubernetes经历了快速发展，吸引了一大批贡献者和用户。

演进阶段

Kubernetes不断演进，增加了对多种云平台的支持，改进了网络和存储功能，增强了安全性。其社区也不断扩大，衍生出众多相关项目和工具，形成了一个庞大的生态系统。

K8s的核心概念和设计理念

核心概念

Pods：Pod是Kubernetes的基本运行单位，代表了在集群中运行的一个或多个容器的组合。
Services：Service是对一组提供相同功能的Pods的抽象，它提供了一个稳定的网络接口。
Deployments：Deployment提供了对Pods和ReplicaSets（副本集）的声明式更新能力。

设计理念

声明式配置：Kubernetes使用声明式配置（而非命令式），用户定义期望状态，系统负责实现这一状态。
自我修复：系统能够自动替换、重启、复制和扩展集群中的节点。
可扩展性：Kubernetes设计了一套强大的APIs，允许在其上构建更复杂的系统。
负载均衡和服务发现：Kubernetes能够自动分配IP地址和DNS名，以及平衡网络流量，以实现高效的服务发现和负载均衡。
多维度资源调度：它支持基于CPU、内存等多种资源类型的调度决策。

Kubernetes的这些概念和设计理念共同构成了其强大的容器编排和管理能力，使其成为当今云原生应用和微服务架构的首选平台。

二、K8s架构深入解析

在这里插入图片描述

架构、应用与优化

Kubernetes的架构设计旨在提供一个分布式、可扩展且高度可用的容器编排平台。它由多个组件构成，协同工作以管理集群的生命周期和操作。

主要组件和节点类型

1. 控制平面（Master节点）

控制平面是Kubernetes的大脑，负责整个集群的管理和协调。它包含几个关键组件：

API服务器（kube-apiserver）：作为集群的前端，处理REST请求，是所有通信的枢纽。
集群数据存储（etcd）：一个轻量级、高可用的键值存储，用于保存所有集群数据。
控制器管理器（kube-controller-manager）：运行控制器进程，这些控制器包括节点控制器、副本控制器等。
调度器（kube-scheduler）：负责决定将新创建的Pod分配给哪个节点。

2. 工作节点（Worker节点）

工作节点是运行应用程序容器的物理服务器或虚拟机。它们包括：

Kubelet：确保容器在Pod中运行，并向控制平面汇报节点的状态。
Kube-Proxy：负责节点上的网络代理，实现服务发现和负载均衡。
容器运行时：负责运行容器，例如Docker或containerd。

控制平面和数据平面的工作原理

控制平面

控制平面维护着集群的全局状态，如调度决策、响应Pod生命周期事件、控制器的逻辑等。它确保集群始终处于用户定义的期望状态。

数据平面

数据平面包括所有工作节点，负责实际运行用户的应用程序。它通过Kubelet和Kube-Proxy来维护Pod的生命周期和网络规则。

集群状态管理和调度算法

集群状态管理

Kubernetes通过etcd来维护集群状态。所有组件都通过API服务器与etcd交互，获取或更改集群的状态信息。

调度算法

Kubernetes调度器采用多步骤的过程来选择最佳节点：

过滤：基于资源需求、策略限制、亲和性规则等过滤掉不适合的节点。
评分：对于剩余节点，基于资源使用率、网络拓扑等因素计算评分。
选择：选择得分最高的节点来部署Pod。

此过程确保了有效的资源分配和负载平衡，同时满足用户对部署位置的具体要求。

Kubernetes架构的每个组成部分都被精心设计以提高效率、可靠性和可扩展性，确保其能够应对各种规模和复杂度的应用需求。

三、容器编排和管理

容器编排是Kubernetes的核心功能，它负责管理容器的生命周期、维护应用的健康和确保服务的可用性。在这一部分，我们将深入探讨Kubernetes在容器编排和管理方面的机制和组件。

Pod生命周期管理

1. Pod的创建

定义：Pod是Kubernetes中最小的部署单元，通常包含一个或多个容器。
配置：通过YAML或JSON文件定义Pod的规格，包括容器镜像、端口、环境变量等。

2. Pod的状态

Pending：Pod已被Kubernetes接受，但有一个或多个容器尚未创建。
Running：Pod已被绑定到一个节点，所有容器都已创建，至少有一个正在运行。
Succeeded：Pod中的所有容器都正常运行并已退出，不会重启。
Failed：Pod中的所有容器都已终止，且至少有一个因故障终止。
Unknown：Pod的状态无法确定。

3. Pod的生命周期钩子

PostStart：在容器创建后立即执行的操作。
PreStop：在容器终止之前执行的操作。

控制器模式

1. Deployment

用途：管理无状态的应用。
功能：确保指定数量的Pod副本始终运行，支持滚动更新和回滚。

2. StatefulSet

用途：管理有状态的应用。
功能：为每个副本维护一个持久的标识符和存储。

3. DaemonSet

用途：在集群的每个节点上运行一份Pod副本。
功能：用于运行日志收集器、监控代理等集群范围的服务。

4. Job和CronJob

用途：执行一次性或定时任务。
功能：Job用于执行批处理任务，CronJob用于定时任务。

服务发现和负载均衡

1. Service

定义：一种抽象，定义了访问一组Pod的方式。
类型

：
- ClusterIP：在集群内部提供一个内部IP。
- NodePort：在每个节点的指定端口上提供访问。
- LoadBalancer：使用外部负载均衡器提供访问。
- ExternalName：通过DNS名映射到外部服务。