自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 资源 (1)
  • 收藏
  • 关注

原创 使用DeepSeek对Prometheus告警进行自动解析并生成处理建议发送至飞书/钉钉

​ 在现代的监控系统中,Prometheus 作为一款开源的监控和告警工具,被广泛应用于各种场景。当系统出现异常时,Prometheus 能够及时触发告警,帮助运维人员快速发现问题。然而,告警信息往往只是简单地告知问题的发生,对于问题的具体原因和处理建议,运维人员还需要花费时间去分析。为了提高运维效率,我们可以借助大语言模型 DeepSeek 对 Prometheus 告警进行自动解析,并将解析结果和处理建议发送到飞书/钉钉,让运维人员能够第一时间了解问题的全貌和解决方案。

2025-03-10 18:51:14 465

原创 Kubernetes 中 Java 应用性能调优

Kubernetes 中 Java 应用性能调优需重点关注容器资源分配、JVM 内存适配、垃圾回收优化和 K8s 调度策略。核心建议包括:使用 MaxRAMPercentage 动态分配堆内存;选择 G1GC 或 ZGC 平衡吞吐与延迟;合理设置线程/连接池;通过 HPA 和 QoS 确保稳定扩缩容。优化不当易导致 OOMKilled、延迟波动或资源浪费,需结合监控持续调优。

2025-06-12 20:11:42 8

原创 Kubernetes 集群安全(身份认证机制、SecurityContext、Network Policy网络策略、预防配置泄露、全面加固集群安全)

Kubernetes集群安全实践摘要: 身份认证机制是K8s安全的第一道防线,支持多种认证方式: TLS客户端证书认证(推荐机器级调用) Token认证(ServiceAccount适用于Pod访问API) OIDC(适合企业SSO集成) Webhook(自定义认证逻辑) SecurityContext提供容器级安全控制,关键配置包括: 限制容器以非root用户运行 禁止特权提升 设置只读文件系统 通过capabilities限制权限 启用seccomp沙箱 网络策略可定义Pod间通信规则,预防配置泄露需加

2025-06-12 20:10:15 210

原创 详解Kubernetes Scheduler 的调度策略

Kubernetes Scheduler调度策略详解:首先通过过滤阶段筛选出符合条件的Node,剔除资源不足或不匹配的节点;随后在评分阶段根据资源利用率、亲和性等规则为节点打分;最后将Pod绑定到最高分节点。Scheduler通过"过滤+评分+绑定"的流程实现高效调度,支持自定义策略和扩展以满足特殊场景需求,如GPU调度或硬件加速。默认策略已优化资源利用和负载均衡,特殊需求可通过修改配置文件或开发Scheduler Extender实现。

2025-05-27 19:21:33 62

原创 kubernetes网络详解(内部网络、Pod IP分配、CNI)

Kubernetes网络详解:本文系统介绍了Kubernetes的网络架构,重点包括Pod网络模型(每个Pod拥有独立IP,通过CNI插件实现通信)、Service网络(ClusterIP、NodePort、LoadBalancer等类型实现服务发现和负载均衡)以及NetworkPolicy的网络隔离机制。文中详细解析了各类Service的配置方式和使用场景,并阐述了CNI插件(如Calico、Flannel等)的核心作用。此外,还介绍了ExternalName和externalIPs等特殊网络配置方案,为

2025-05-27 19:19:24 329

原创 Kubernetes 中的消息小能手 Informer

Kubernetes Informer 是集群中高效监听资源变化的核心组件,通过"订阅+缓存"机制大幅提升性能。它首先拉取资源初始状态建立缓存,然后通过Watch接口实时监听资源变更,自动触发回调函数并更新本地缓存。Informer搭配Lister使用,使Controller能快速查询缓存而非频繁访问API Server,显著降低系统负载。这种设计让K8s控制面既能实时响应变化,又保持高效稳定,成为支撑大规模集群的关键技术。示例展示了如何通过SharedInformerFactory创建

2025-05-27 19:15:32 20

原创 Kubernetes 中的CRD(Custom Resource Definition)与Operator详解

Kubernetes中的CRD与Operator详解 CRD(自定义资源定义)允许用户在Kubernetes中定义新的API资源类型,扩展集群功能而不修改源码。通过CRD可以创建类似原生资源(如Deployment)的自定义资源(如KafkaCluster),并像管理内置资源一样操作它们。CRD通常与Operator配合使用,Operator是一种智能控制器,能够基于业务逻辑自动管理应用程序的生命周期。 Operator由CRD、Controller和Reconcile Loop三部分组成,通过持续监控资源

2025-05-27 19:14:10 299

原创 Kubernetes CSI:存储插件的关键功能与部署

Kubernetes CSI存储插件部署与实践 本文详细介绍了Kubernetes容器存储接口(CSI)的核心组件架构与部署方案。CSI包含两个关键组件:Controller(通过Deployment单实例部署)和Node(通过DaemonSet部署)。Controller负责存储卷管理,包含external-provisioner等sidecar容器;Node负责节点级存储操作,包含node-driver-registrar等组件。 文章以csi-hostpath插件为例,演示了完整的部署流程:首先需为k

2025-05-27 19:12:44 27

原创 Kubernetes Admission Controller (准入控制器)详解:作用、原理、常见类型

Kubernetes Admission Controller详解 Kubernetes Admission Controller是集群安全的"守门员",在资源创建/更新时进行检查或修改。它分为两种类型:Mutating(可修改资源对象,如自动注入sidecar)和Validating(仅校验不修改对象)。常见控制器包括:AlwaysPullImages(强制远程拉取镜像)、NamespaceLifecycle(保护关键命名空间)、LimitRanger(资源限制)、PodSecurit

2025-05-27 19:11:14 46

原创 k8s集群访问控制之RBAC授权

每个名称空间下,user都通过rolebinding绑定role,定义一个ClusterRole拥有集群级别的操作权限,通过ClusterRolebinding与user绑定,该用户user就有了集群级别的操作权限。这两个都是集群角色的管理员,那么当集群中有多个名称空间的时候,就不需要手动去创建管理员角色,直接可以使用admin的角色机型rolebinding,这样省去了很多重复工作。所以说,之后的所有的操作许可,都是直接授权给角色(Role),而不是直接授权给用户。来绑定的,突破不来名称空间。

2025-05-27 19:09:44 30

原创 详解K8s API Server 如何处理请求的?

步骤作用示例1. 接收请求解析 HTTP 请求2. 认证(Authentication)验证身份检查 Token / 证书3. 鉴权(Authorization)检查权限RBAC 角色管理4. 准入控制(Admission Control)校验 & 变更资源自动添加默认值、检查安全策略5. 存储 & 变更存入 etcd & 触发变更Scheduler 监听 Pod,分配 Node🔥API Server = K8s 的“守门员”+“审批官”+“数据库接口”!

2025-05-27 19:07:16 425

原创 Archery修改SQL上线-检测与执行规则

账号密码随便填,因为Inception没有权限验证的过程。

2023-04-12 14:21:03 1150 1

原创 Prometheus基于kubernetes告警规则-告警等级划分(不同渠道告警)

Prometheus基于kubernetes告警规则-告警等级划分(不同渠道告警)

2023-04-12 14:11:45 2046 1

原创 Archery-SQL审核查询平台

数据库查询审核执行备份数据字典慢日志会话管理账号管理参数管理数据归档MySQL√√√√√√√√√√MsSQL√×√×√×××××Redis√×√×××××××PgSQL√×√×××××××Oracle√√√√√×××××MongoDB√√√×××××××Phoenix√×√×××××××ODPS√××××××××。

2023-02-13 14:49:13 1596

原创 GitHub Actions教程-Google-GKE

我们项目在部署到K8s的时候需要一个deployment的yaml,但是这个yaml里面的镜像tag是随着github action的自动创建的ID生成的,所以第一步就是要解决这个问题,这里我使用了一个这个仓库 datamonsters/replace-action 来做的替换,下面看我K8s的deployment里面具体怎么写的。在了解了何为 Github Actions 后,再来通过一个基本的例子来学习下它的基本概念,注意,由于篇幅有限,我们只会讲解最常用的部分,如果想要完整的学习,请移步。

2023-02-07 16:44:15 659 1

原创 kubernetes部署nacos集群(防坑)

Nacos 致力于帮助您发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据及流量管理。客户端拥有相同的计算逻辑,用户如同1.X的使用方式,配置主端口(默认8848),通过相同的偏移量,计算对应gRPC端口(默认9848)。异常是由com.alipay.sofa.jraft.***类抛出的,让我去查看alipay-jraft.log日志。因此如果客户端和服务端之前存在端口转发,或防火墙时,需要对端口转发配置和防火墙配置做相应的调整。

2023-01-06 15:33:25 1640 1

原创 Kubernetes 运行数据库存在的问题剖析

伴随着互联网应用场景逐渐深入到生活的各个角落,为了确保前端用户的使用体验,对互联网产品的后端架构性能提出了更高的需求。如今,开发以及运维人员正在将工作重心和优化重点放在了后端基础设施的可用性、一致性、扩展性、弹性以及全面自动化管理等能够提升效率的技术能力层面。

2022-12-14 17:37:48 264

原创 开源日志采集器如何选择?

日志采集是整个日志基础设施中最基础最关键的组件之一,影响着企业内部数据的完整性以及实时性。采集器作为数据链路的前置环节,其可靠性、扩展性、灵活性以及资源(CPU 和内存)消耗等,往往是最被关注的核心技术点。目前开源的日志采集器比较多。各采集器官网上关于其产品特性的描述也都比较相似,基本上都包括日志搜集、转换、路由等功能,并且无一例外都会突出其为高性能而设计。如果单纯看产品文档,其实很难在前面提到的核心技术点上得出有区分度的结论,若直接在生产环境上使用,则无疑是高压线上走钢丝。

2022-12-14 11:26:49 1639 2

原创 prometheus配置文件详解

prometheus配置文件详解

2022-11-03 15:34:25 658

原创 Grafana简介及使用

Grafana简介及使用

2022-11-03 15:30:33 928

原创 PromQL语法

Prometheus 提供了一种功能表达式语言 PromQL,允许用户实时选择和汇聚时间序列数据。表达式的结果可以在浏览器中显示为图形,也可以显示为表格数据,或者由外部系统通过 HTTP API调用。

2022-11-03 15:20:08 672

原创 Prometheus kube-state-metrics 监控指标介绍

Prometheus kube-state-metrics 监控指标介绍

2022-11-03 15:18:37 959

原创 Prometheus基于kubernetes实现监控告警---飞书告警(告警规则最全)

Prometheus基于kubernetes实现监控告警---飞书告警

2022-11-03 15:17:09 2506

原创 kubernetes部署Elasticsearch cluster & Kibana & Cerebro

kubernetes部署Elasticsearch cluster & Kibana & Cerebro

2022-09-26 15:31:46 730

转载 浅谈云原生系统日志收集在数栈的实践

浅谈云原生系统日志收集在数栈的实践

2022-08-18 15:26:29 622

原创 创建Storageclass存储类-基于csi-nfs-driver

创建Storageclass存储类-基于csi-nfs-driver

2022-08-17 16:04:08 595

原创 kubectl插件管理工具krew

kubectl插件管理工具krew

2022-08-16 14:51:45 750

原创 ES——Fluent-bit——kibana组建日志收集系统---docker方式部署

ES——Fluent-bit——kibana组建日志收集系统---docker方式部署

2022-08-11 14:25:46 2222 2

原创 Kubernetes ---集群安全机制

在 k8s 中,所有资源的访问和变更都是围绕 APIServer 展开的。比如说 kubectl 命令、客户端 HTTP RESTFUL 请求,都是去 call APIServer 的 API 进行的。上面这张图,描述了用户在访问或变更资源的之前,需要经过 APIServer 的认证机制、授权机制以及准入控制机制。这三个机制可以这样理解,先检查是否合法用户,再检查该请求的行为是否有权限,最后做进一步的验证或添加默认参数。k8s 中有两种用户,一种是内置“用户” ServiceAccount,另一种我称之为自

2022-06-15 15:04:29 205

原创 kubelet---关于垃圾镜像/容器回收策略

kubelet---关于垃圾镜像/容器回收策略

2022-06-15 11:39:26 589

原创 kubelet 配置节点资源预留

kubelet 配置节点资源预留

2022-06-15 11:26:04 413

原创 kubernetes集群调度

kubernetes集群调度

2022-06-09 16:13:28 149

原创 Helm安装Zadig云原生软件交付平台

Helm安装Zadig云原生软件交付平台

2022-05-18 16:41:30 650

原创 Fluentd、Filebeat、Logstash 对比分析

Fluentd、Filebeat、Logstash 对比分析

2022-05-18 16:19:27 3646

原创 Helm 安装 Ingress-nginx

Helm 安装 Ingress-nginx

2022-05-18 16:04:49 2204

原创 容器化技术到kubernetes容器编排技术

容器化技术到kubernetes容器编排技术

2022-05-18 13:48:34 526

原创 POD控制器(Controller控制器)详解

POD控制器(Controller控制器)详解

2022-05-18 13:14:28 534

原创 Docker、Podman、Containerd 谁才是真正王者?

Docker、Podman、Containerd 谁才是真正王者?

2022-05-13 10:57:59 10903 1

原创 Helm方式安装并使用 ingress-traefik

Helm方式安装并使用 ingress-traefik

2022-04-25 16:59:28 1126

原创 helm搭建NFS的StorageClass存储类

helm搭建NFS的StorageClass存储类

2022-04-14 10:32:25 738

二进制方式部署k8s集群相关配置文件及依赖包

网络组件yaml文件:calico.yaml cfss生成证书安装包 etcd二次开发包:etcd-v3.4.9-linux-amd64.tar.gz k8s二进制安装包:kubernetes-server-v1.20.5-linux-amd64.tar.gz

2022-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除