- 博客(616)
- 资源 (10)
- 收藏
- 关注
原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-06-大数据架构设计案例分析(二)Lambda架构在某网广告平台的应用与演进
《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-06-大数据架构设计案例分析(二)Lambda架构在某网广告平台的应用与演进
2026-04-02 14:00:00
499
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(下)
1. SLO(服务级别目标)`apiserver_request_slo_duration_seconds_count``apiserver_request_slo_duration_seconds_bucket``apiserver_request_slo_duration_seconds_sum`2. filter(过滤器)`apiserver_request_filter_duration_seconds_count``apiserver_request_filter_duration_s
2026-04-02 08:00:00
609
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(中)
1.3 安全与控制1)group="authentication.k8s.io"(认证)resource="tokenreviews"2)group="authorization.k8s.io"(授权审查)3)group="rbac.authorization.k8s.io"(RBAC 权限)resource="roles"resource="clusterroles"resource="rolebindings"resource="clusterrolebindings"……
2026-04-01 07:30:00
385
原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-05- Lambda 架构与 Kappa 架构的对比和设计选择
《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-05- Lambda 架构与 Kappa 架构的对比和设计选择
2026-03-31 14:00:00
246
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(上)
1. `apiserver_request_duration_seconds_count`1.1 API 服务group="apiregistration.k8s.io"(API 聚合)resource="apiservices"1.2 核心业务资源(工作负载 + 基础对象)1)group=""resource="nodes"resource="namespaces"resource="pods"resource="services"resource="configmaps"……
2026-03-31 07:30:00
525
原创 master-01网卡宕机后不显示 NotReady
本文记录 K8s 高可用测试异常:master-01 停网卡仍显 Ready,排查系 kubelet 绑定 VIP 所致,修改配置绑定节点 IP 重启后,故障恢复,节点状态与 Pod 驱逐正常。
2026-03-26 13:30:00
60
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第二部分)flowcontrol 流量控制(下)样本、水位
本文详细解读 K8s APIServer 流控监控指标,分为样本(samples)和水位(watermark)两大板块,涵盖请求、坐席、读写请求三类细分维度
2026-03-26 07:45:00
716
原创 k8s的一些配置和优化
1. 心跳时间和驱逐时间1.1 修改配置1.2 说明2. 配置k8s和system预留资源2.1 修改配置2.2 重启kubelet2.3 测试3. master节点绑定IP3.1 修改配置文件3.2 说明3.3 重启kubelet
2026-03-25 07:30:00
186
原创 给用户分配RBAC权限完整示例、给已有用户增加其他namespace权限示例、给已有namespace添加其他用户权限示例
1. 权限创建1.1 创建集群角色(ClusterRole)1.2 创建服务账户1.3 创建角色绑定2. 权限分配2.1 kubeconfig 配置文件2.2 文件分发3. 验证权限3.1 测试当前命名空间权限3.2 测试其他命名空间权限4. 给已有用户添加namespace权限4.1 创建服务账户4.2 创建角色绑定4.3 测试5. 添加一个新用户5.1 创建集群角色5.2 创建角色绑定5.3 kubeconfig 配置文件5.4 创建linux用户
2026-03-24 07:30:00
744
原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-04-Kappa架构
本文全面解析Kappa架构,从大数据特性出发,介绍其基于Lambda架构简化而来的核心设计——舍弃批处理层,以消息队列(如Kafka)为核心,实现实时与历史数据统一处理。详解架构原理、部署实现步骤,对比其与Lambda架构的适用场景,剖析优缺点,并介绍Kappa+、Flink+Elasticsearch等变形架构。内容兼具理论性与实操性,清晰呈现架构核心价值与落地要点,助力技术人员快速理解、选型及部署Kappa架构,适配各类大数据处理场景
2026-03-19 13:30:00
650
原创 prometheus监控nginx,安装 prometheus-nginxlog-exporter分析nginx日志
本文详细介绍prometheus-nginxlog-exporter的完整部署、配置及Prometheus接入流程。包含创建目录、编写适配Nginx日志格式的配置文件,提供Docker/nerdctl Compose部署脚本,说明日志目录挂载关键要点;同时讲解Prometheus测试 exporter、添加监控任务的方法,以及通过PromQL查询监控指标的操作。可快速实现Nginx日志指标提取与监控,适配生产环境,助力运维人员高效掌握Nginx请求、性能及上游服务状态。
2026-03-19 07:30:00
558
原创 docker-compose 启动VM时序数据库( VictoriaMetrics)搭建、prometheus数据接入、备份恢复
本文提供 VictoriaMetrics 一键 Docker Compose 部署教程,含服务启动、读写验证、Prometheus 远程写入及指标过滤配置。同时给出快照备份、定时清理与数据恢复完整流程,轻量高效,可直接用于生产环境搭建时序数据库。
2026-03-18 07:00:00
383
原创 k8s环境使用helm部署redis集群(三主三从)
本文提供K8s 环境下 Redis 6.2 三主三从集群标准化部署方案,基于 Bitnami 官方 Helm Chart 实现,适配企业内网私有仓库场景。支持自定义命名空间、默认 StorageClass 持久化存储、密码认证,直接替换镜像地址、密码、存储大小即可复用。通过 Helm 一键安装,部署后完成集群状态校验、主从角色验证与数据读写测试,确保集群高可用、槽位分配正常、主从复制稳定,可直接用于生产环境快速落地 Redis 集群。
2026-03-17 07:00:00
409
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第二部分)flowcontrol 流量控制(上)请求和请求的资源消耗
本文详解 K8s APIServer 流量控制器监控体系,系统讲解 apiserver_flowcontrol 系列指标,覆盖请求执行、队列、等待时长、并发限制等场景,结合真实集群数据说明指标用法与优先级、流模式分类,并拆解 S 值、R 值调度原理,帮助运维人员快速定位瓶颈、优化限流策略,适用于生产环境监控与性能调优。
2026-03-12 07:00:00
561
原创 《golang设计模式》第三部分·行为型模式-11-访问者模式(Visitor)
访问者(Visitor)用于封装施加在聚合体中聚合元素的操作(或算法),从而使该操作(或算法)从聚合对象中分离出来,在不对聚合对象产生影响的前提下实现自由扩展。
2026-03-11 07:00:00
396
原创 自建网盘,docker-compose启动next_clou并集成ldap认证
自建网盘,docker-compose启动next_cloud,集成ldap认证
2026-03-10 13:00:00
63
原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第一部分) 抓取(scrape)本身和认证鉴权
这份文档系统梳理了Kubernetes API Server 核心监控指标,覆盖 Prometheus 抓取状态、准入控制、认证授权、节点鉴权、Pod 安全及服务账号等关键场景。详细说明 up、scrape_duration_seconds 等基础抓取指标,解析准入控制器、Webhook、认证 Token 缓存、Node Authorizer 等核心性能与安全指标,包含指标含义、标签说明与真实示例,可直接用于 K8s 监控告警、性能排查与安全审计,是运维与监控人员快速定位集群问题的实用手册
2026-03-10 07:00:00
612
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第六部分)ingres、lease、networkpolicy等
本文详解 kube-state-metrics 中 Ingress、Lease、NetworkPolicy、MutatingWebhookConfiguration 等资源监控指标,含字段含义、标签说明、示例与实战解读,覆盖节点心跳、组件选主、Ingress 路由、TLS、网络策略、Webhook 配置,助力 K8s 可观测性与运维排查。
2026-03-05 07:00:00
351
原创 ubuntu 22.04使用systemd-timesyncd同步内网ntp服务器
本文详细讲解Linux两种NTP同步方法:timesyncd.conf配置与chrony工具使用。含具体配置步骤、重启命令、状态验证及强制同步方法,清晰解读同步状态参数,还包含chrony安装、上级NTP配置及本机作为NTP服务器的设置,实操性极强,助力快速完成内网时间同步,避免公网连接风险。
2026-03-04 07:00:00
476
原创 ubuntu 22.04 安装k8s时 coredns 一直显示 CrashLoopBackOff
ubuntu 22.04 安装k8s时 coredns 一直显示 CrashLoopBackOff 的问题解决。
2026-03-03 07:00:00
272
原创 使用 Helm 部署 Bitnami 版本的 postgres + pgpool 集群
本文档提供了在Kubernetes中使用Bitnami Helm Chart部署PostgreSQL 16.5高可用集群的完整指南。内容涵盖Chart准备、镜像拉取、自定义配置(pg-values.yaml)、服务部署、主从验证及数据同步测试。文档重点说明了通过postgresql.maxConnections参数正确修改最大连接数的方法,并提供了集群卸载步骤以及处理主从不同步的滚动重启方案
2026-03-02 07:00:00
967
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第五部分)configmap、secret、PV、PVC、storageClass
本文介绍了Kubernetes存储相关资源(ConfigMap、Secret、PV、PVC、StorageClass)在Prometheus监控体系下的核心指标。重点解析了各类资源的创建时间、基本信息、全局版本、状态、容量、绑定关系和关键配置(如回收策略、访问模式)等监控维度,并以kube-state-metrics输出的真实指标数据为例,展示了如何通过这些指标洞察集群存储资源的生命周期与实时状态,为运维监控和告警提供数据基础。
2026-02-27 07:00:00
1559
原创 ubuntu 内网自建apt源(apt-mirror)
本文详细介绍了使用 apt-mirror 搭建企业内部 Ubuntu 软件源仓库的完整流程。主要内容包括安装和配置 apt-mirror 工具,执行同步命令以下载官方软件包镜像,以及通过 Nginx 容器快速部署一个本地 Web 服务器来提供源服务。文章还指导了客户端如何修改源地址进行使用,并额外演示了如何将 Docker 官方apt源加入列表。这套方案能有效加快内网环境下的软件包安装与更新速度。
2026-02-26 07:00:00
1101
原创 nerdctl 替代 Docker 命令手册
本文提供了Docker命令与nerdctl命令的详细对照表,涵盖了容器、镜像、网络及Compose服务的日常操作。主要内容包括基础命令如登录、拉取、构建、推送镜像以及网络管理,还涉及批量删除容器和清理未使用资源等维护命令。通过具体的代码示例,如使用nerdctl build构建镜像和nerdctl compose管理服务,帮助用户快速从Docker迁移至nerdctl环境,确保工作流程的平滑过渡与兼容性
2026-02-25 07:00:00
610
原创 【Kyverno】策略配置完整指南
这份文档是Kyverno策略完整教程,介绍其核心结构与用法:1. 策略分集群级ClusterPolicy和命名空间级Policy;2. 用match/exclude匹配/排除资源,支持类型、名称、标签等条件;3. 提供mutate(修改资源)、validate(校验配置)、generate(自动生成资源)三大能力;4. 给出YAML语法与生产示例,可实现安全加固、规范检查、自动生成网络策略等场景,助力Kubernetes资源统一管控。
2026-02-24 07:00:00
971
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第四部分)statfulset、daemonset、job
本文详细解析了kube-state-metrics中StatefulSet、DaemonSet和Job相关监控指标的含义与用法。涵盖了副本状态、就绪情况、更新进度、调度统计及任务完成状态等关键度量,通过具体示例说明各指标在集群运维中的实际作用,为监控和诊断工作负载提供了清晰的参考依据
2026-02-05 07:00:00
2061
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第三部分)deployment、replicaset的监控项
本文梳理 kube-state-metrics 中 Deployment 与 ReplicaSet 的核心监控指标,涵盖创建时间、代次变化、期望副本与实际副本对比,以及滚动更新策略参数(maxSurge、maxUnavailable)。重点说明 Ready、Available、Unavailable、Updated 等副本状态指标在发布进度跟踪与可用性评估中的作用,并补充 ReplicaSet 的就绪副本、标签一致副本等监控项,用于判断控制器与 Pod 状态是否一致,为告警设计和故障排查提供依据。
2026-02-04 07:00:00
1039
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第二部分)pod、container
本文介绍了Kubernetes中Pod相关的关键监控指标,包括创建时间(kube_pod_created)、启动时间(kube_pod_start_time)和完成时间(kube_pod_completion_time)的时间戳指标,以及Pod基本信息(kube_pod_info)、所有者关系(kube_pod_owner)、所在节点IP(kube_pod_ips)和重启策略(kube_pod_restart_policy)等元数据指标。这些指标通过kube-state-metrics组件采集,包含clus
2026-02-03 07:00:00
709
原创 【mariadb】docker-compose 部署mariadb 主从复制(mariadb:11.5.2)
虽然和mysql大差不差,但是差别就是要踩的坑。
2026-01-29 07:00:00
584
原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第一部分)apiserver、node、namespace、service、endpoint
【代码】prometheus监控k8s的metric详解(第二版)第一章 kube-state-metrics-第一部分-apiserver、node、namespace、service、endpoint。
2026-01-28 07:00:00
1179
原创 Prometheus监控k8s的metric详解(第二版)第一章 scrape 指标抓取
1. `scrape_duration_seconds`1.1 job=kube-state-metrics1.2 job="kubernetes-apiservers"1.3 job="kubernetes-cadvisor"1.4 job="kubernetes-nodes"1.5 job="kubernetes-pods "1.6 job="kubernetes-service-endpoints"1.7 其他job2 `scrape_samples_scraped`3 `scrap
2026-01-27 08:49:28
623
原创 容器启动的mysql主从同步失败问题的快速解决
摘要 本文介绍容器化MySQL主从同步异常的快速修复方案。当从服务器异常关机导致主从不同步时,通过以下步骤解决:1)停止主从容器;2)备份从库data目录后,用主库data目录覆盖从库,并修改auto.cnf文件;3)启动主库并记录master状态;4)从库重新配置主从关系,使用CHANGE MASTER命令指定主库信息。最后验证Slave状态确认同步恢复。该方法适用于不确定同步中断时间点的场景,通过数据全量覆盖实现快速修复。
2026-01-21 14:00:00
177
原创 k8s 平台安装 Kyverno组件完整过程
1. 先决条件2.安装步骤2.1 在线安装2.2 离线安装1)下载chart2)准备镜像3)安装2.3 安装结果3. 测试3.1 创建规则3.2 验证规则
2026-01-21 07:00:00
664
原创 Prometheus报错:expected label name, got “INVALID“
k8s的label不合法造成Prometheus报错:expected label name, got “xxxxx“
2026-01-19 13:30:00
697
原创 K8S的ETCD集群证书详解及应用(etcd节点重建实例、etcd集群更换证书实例)
1. etcd 集群的证书1.1 证书说明1.2 查看证书1)根证书2)对等通信证书(Peer)3)服务端证书(Server)4)健康检查客户端证书(Healthcheck)1.3 生成证书1)根证书2)其他证书(手动创建)3)kubeadm创建(和手动二选一)2. 【实例1】重建其中一个节点
2026-01-19 07:00:00
657
原创 prometheus监控k8s的metric详解-06-etcd、storage、machine、process
如下边第2条数据表示:“etcd租约对象计数”(即,etcd_lease_object_counts) < 10 的 分布的次数。作用:“etcd中租约对象计数”(每次租约对象数量变化都会进行一个计数)这个操作的计数。
2025-12-11 10:04:11
994
原创 GPU节点接入k8s集群的处理
本文提供了一个在Kubernetes集群中集成和管理NVIDIA GPU节点的实用操作指南。主要内容包括:在Ubuntu节点上离线安装NVIDIA容器运行时工具链,并配置Docker和Containerd以支持GPU容器;安装NVIDIA Fabric Manager和DCGM等高级管理插件以启用完整功能;最后,将准备好的GPU节点加入Kubernetes集群,并通过部署官方的Device Plugin DaemonSet,使集群能够发现、调度和使用GPU计算资源。整个流程涵盖了从系统级配置到Kuberne
2025-12-10 14:00:00
564
openssh-9.3p2升级包(openssh、zlib、openssl)
2024-07-29
Vue 2.0 路由示例(赤壁之战指挥官查询)
2022-05-30
kubeadm_1_15_11.tar.gz
2021-08-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅