自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

架构+开发+运维

系统之美、架构之美、IT之美

  • 博客(616)
  • 资源 (10)
  • 收藏
  • 关注

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-06-大数据架构设计案例分析(二)Lambda架构在某网广告平台的应用与演进

《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-06-大数据架构设计案例分析(二)Lambda架构在某网广告平台的应用与演进

2026-04-02 14:00:00 499

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(下)

1. SLO(服务级别目标)`apiserver_request_slo_duration_seconds_count``apiserver_request_slo_duration_seconds_bucket``apiserver_request_slo_duration_seconds_sum`2. filter(过滤器)`apiserver_request_filter_duration_seconds_count``apiserver_request_filter_duration_s

2026-04-02 08:00:00 609

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(中)

1.3 安全与控制1)group="authentication.k8s.io"(认证)resource="tokenreviews"2)group="authorization.k8s.io"(授权审查)3)group="rbac.authorization.k8s.io"(RBAC 权限)resource="roles"resource="clusterroles"resource="rolebindings"resource="clusterrolebindings"……

2026-04-01 07:30:00 385

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-05- Lambda 架构与 Kappa 架构的对比和设计选择

《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-05- Lambda 架构与 Kappa 架构的对比和设计选择

2026-03-31 14:00:00 246

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第三部分)request(上)

1. `apiserver_request_duration_seconds_count`1.1 API 服务group="apiregistration.k8s.io"(API 聚合)resource="apiservices"1.2 核心业务资源(工作负载 + 基础对象)1)group=""resource="nodes"resource="namespaces"resource="pods"resource="services"resource="configmaps"……

2026-03-31 07:30:00 525

原创 master-01网卡宕机后不显示 NotReady

本文记录 K8s 高可用测试异常:master-01 停网卡仍显 Ready,排查系 kubelet 绑定 VIP 所致,修改配置绑定节点 IP 重启后,故障恢复,节点状态与 Pod 驱逐正常。

2026-03-26 13:30:00 60

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第二部分)flowcontrol 流量控制(下)样本、水位

本文详细解读 K8s APIServer 流控监控指标,分为样本(samples)和水位(watermark)两大板块,涵盖请求、坐席、读写请求三类细分维度

2026-03-26 07:45:00 716

原创 k8s的一些配置和优化

1. 心跳时间和驱逐时间1.1 修改配置1.2 说明2. 配置k8s和system预留资源2.1 修改配置2.2 重启kubelet2.3 测试3. master节点绑定IP3.1 修改配置文件3.2 说明3.3 重启kubelet

2026-03-25 07:30:00 186

原创 k8s的ETCD数据快照库备份和恢复

1. 启动备份pod2. 备份测试3. 定时任务4. 备份恢复4.1 创建恢复用临时Pod4.2 恢复操作

2026-03-24 12:30:00 300

原创 给用户分配RBAC权限完整示例、给已有用户增加其他namespace权限示例、给已有namespace添加其他用户权限示例

1. 权限创建1.1 创建集群角色(ClusterRole)1.2 创建服务账户1.3 创建角色绑定2. 权限分配2.1 kubeconfig 配置文件2.2 文件分发3. 验证权限3.1 测试当前命名空间权限3.2 测试其他命名空间权限4. 给已有用户添加namespace权限4.1 创建服务账户4.2 创建角色绑定4.3 测试5. 添加一个新用户5.1 创建集群角色5.2 创建角色绑定5.3 kubeconfig 配置文件5.4 创建linux用户

2026-03-24 07:30:00 744

原创 《系统架构设计师教程(第2版)》第19章-大数据架构设计理论与实践-04-Kappa架构

本文全面解析Kappa架构,从大数据特性出发,介绍其基于Lambda架构简化而来的核心设计——舍弃批处理层,以消息队列(如Kafka)为核心,实现实时与历史数据统一处理。详解架构原理、部署实现步骤,对比其与Lambda架构的适用场景,剖析优缺点,并介绍Kappa+、Flink+Elasticsearch等变形架构。内容兼具理论性与实操性,清晰呈现架构核心价值与落地要点,助力技术人员快速理解、选型及部署Kappa架构,适配各类大数据处理场景

2026-03-19 13:30:00 650

原创 prometheus监控nginx,安装 prometheus-nginxlog-exporter分析nginx日志

本文详细介绍prometheus-nginxlog-exporter的完整部署、配置及Prometheus接入流程。包含创建目录、编写适配Nginx日志格式的配置文件,提供Docker/nerdctl Compose部署脚本,说明日志目录挂载关键要点;同时讲解Prometheus测试 exporter、添加监控任务的方法,以及通过PromQL查询监控指标的操作。可快速实现Nginx日志指标提取与监控,适配生产环境,助力运维人员高效掌握Nginx请求、性能及上游服务状态。

2026-03-19 07:30:00 558

原创 docker-compose 启动VM时序数据库( VictoriaMetrics)搭建、prometheus数据接入、备份恢复

本文提供 VictoriaMetrics 一键 Docker Compose 部署教程,含服务启动、读写验证、Prometheus 远程写入及指标过滤配置。同时给出快照备份、定时清理与数据恢复完整流程,轻量高效,可直接用于生产环境搭建时序数据库。

2026-03-18 07:00:00 383

原创 k8s的一些零散的命令(kubectl、kubeadm)

k8s的一些零碎的命令

2026-03-17 12:00:00 216

原创 k8s环境使用helm部署redis集群(三主三从)

本文提供K8s 环境下 Redis 6.2 三主三从集群标准化部署方案,基于 Bitnami 官方 Helm Chart 实现,适配企业内网私有仓库场景。支持自定义命名空间、默认 StorageClass 持久化存储、密码认证,直接替换镜像地址、密码、存储大小即可复用。通过 Helm 一键安装,部署后完成集群状态校验、主从角色验证与数据读写测试,确保集群高可用、槽位分配正常、主从复制稳定,可直接用于生产环境快速落地 Redis 集群。

2026-03-17 07:00:00 409

原创 【sqlserver】docker-compose启动sql-server

docker-compose启动sql-server

2026-03-12 13:00:00 58

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第二部分)flowcontrol 流量控制(上)请求和请求的资源消耗

本文详解 K8s APIServer 流量控制器监控体系,系统讲解 apiserver_flowcontrol 系列指标,覆盖请求执行、队列、等待时长、并发限制等场景,结合真实集群数据说明指标用法与优先级、流模式分类,并拆解 S 值、R 值调度原理,帮助运维人员快速定位瓶颈、优化限流策略,适用于生产环境监控与性能调优。

2026-03-12 07:00:00 561

原创 《golang设计模式》第三部分·行为型模式-11-访问者模式(Visitor)

访问者(Visitor)用于封装施加在聚合体中聚合元素的操作(或算法),从而使该操作(或算法)从聚合对象中分离出来,在不对聚合对象产生影响的前提下实现自由扩展。

2026-03-11 07:00:00 396

原创 自建网盘,docker-compose启动next_clou并集成ldap认证

自建网盘,docker-compose启动next_cloud,集成ldap认证

2026-03-10 13:00:00 63

原创 prometheus监控k8s的metric详解(第二版)第三章 kubernetes-apiservers (第一部分) 抓取(scrape)本身和认证鉴权

这份文档系统梳理了Kubernetes API Server 核心监控指标,覆盖 Prometheus 抓取状态、准入控制、认证授权、节点鉴权、Pod 安全及服务账号等关键场景。详细说明 up、scrape_duration_seconds 等基础抓取指标,解析准入控制器、Webhook、认证 Token 缓存、Node Authorizer 等核心性能与安全指标,包含指标含义、标签说明与真实示例,可直接用于 K8s 监控告警、性能排查与安全审计,是运维与监控人员快速定位集群问题的实用手册

2026-03-10 07:00:00 612

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第六部分)ingres、lease、networkpolicy等

本文详解 kube-state-metrics 中 Ingress、Lease、NetworkPolicy、MutatingWebhookConfiguration 等资源监控指标,含字段含义、标签说明、示例与实战解读,覆盖节点心跳、组件选主、Ingress 路由、TLS、网络策略、Webhook 配置,助力 K8s 可观测性与运维排查。

2026-03-05 07:00:00 351

原创 ubuntu 22.04使用systemd-timesyncd同步内网ntp服务器

本文详细讲解Linux两种NTP同步方法:timesyncd.conf配置与chrony工具使用。含具体配置步骤、重启命令、状态验证及强制同步方法,清晰解读同步状态参数,还包含chrony安装、上级NTP配置及本机作为NTP服务器的设置,实操性极强,助力快速完成内网时间同步,避免公网连接风险。

2026-03-04 07:00:00 476

原创 ubuntu 22.04 安装k8s时 coredns 一直显示 CrashLoopBackOff

ubuntu 22.04 安装k8s时 coredns 一直显示 CrashLoopBackOff 的问题解决。

2026-03-03 07:00:00 272

原创 使用 Helm 部署 Bitnami 版本的 postgres + pgpool 集群

本文档提供了在Kubernetes中使用Bitnami Helm Chart部署PostgreSQL 16.5高可用集群的完整指南。内容涵盖Chart准备、镜像拉取、自定义配置(pg-values.yaml)、服务部署、主从验证及数据同步测试。文档重点说明了通过postgresql.maxConnections参数正确修改最大连接数的方法,并提供了集群卸载步骤以及处理主从不同步的滚动重启方案

2026-03-02 07:00:00 967

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第五部分)configmap、secret、PV、PVC、storageClass

本文介绍了Kubernetes存储相关资源(ConfigMap、Secret、PV、PVC、StorageClass)在Prometheus监控体系下的核心指标。重点解析了各类资源的创建时间、基本信息、全局版本、状态、容量、绑定关系和关键配置(如回收策略、访问模式)等监控维度,并以kube-state-metrics输出的真实指标数据为例,展示了如何通过这些指标洞察集群存储资源的生命周期与实时状态,为运维监控和告警提供数据基础。

2026-02-27 07:00:00 1559

原创 ubuntu 内网自建apt源(apt-mirror)

本文详细介绍了使用 apt-mirror 搭建企业内部 Ubuntu 软件源仓库的完整流程。主要内容包括安装和配置 apt-mirror 工具,执行同步命令以下载官方软件包镜像,以及通过 Nginx 容器快速部署一个本地 Web 服务器来提供源服务。文章还指导了客户端如何修改源地址进行使用,并额外演示了如何将 Docker 官方apt源加入列表。这套方案能有效加快内网环境下的软件包安装与更新速度。

2026-02-26 07:00:00 1101

原创 nerdctl 替代 Docker 命令手册

本文提供了Docker命令与nerdctl命令的详细对照表,涵盖了容器、镜像、网络及Compose服务的日常操作。主要内容包括基础命令如登录、拉取、构建、推送镜像以及网络管理,还涉及批量删除容器和清理未使用资源等维护命令。通过具体的代码示例,如使用nerdctl build构建镜像和nerdctl compose管理服务,帮助用户快速从Docker迁移至nerdctl环境,确保工作流程的平滑过渡与兼容性

2026-02-25 07:00:00 610

原创 【Kyverno】策略配置完整指南

这份文档是Kyverno策略完整教程,介绍其核心结构与用法:1. 策略分集群级ClusterPolicy和命名空间级Policy;2. 用match/exclude匹配/排除资源,支持类型、名称、标签等条件;3. 提供mutate(修改资源)、validate(校验配置)、generate(自动生成资源)三大能力;4. 给出YAML语法与生产示例,可实现安全加固、规范检查、自动生成网络策略等场景,助力Kubernetes资源统一管控。

2026-02-24 07:00:00 971

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第四部分)statfulset、daemonset、job

本文详细解析了kube-state-metrics中StatefulSet、DaemonSet和Job相关监控指标的含义与用法。涵盖了副本状态、就绪情况、更新进度、调度统计及任务完成状态等关键度量,通过具体示例说明各指标在集群运维中的实际作用,为监控和诊断工作负载提供了清晰的参考依据

2026-02-05 07:00:00 2061

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第三部分)deployment、replicaset的监控项

本文梳理 kube-state-metrics 中 Deployment 与 ReplicaSet 的核心监控指标,涵盖创建时间、代次变化、期望副本与实际副本对比,以及滚动更新策略参数(maxSurge、maxUnavailable)。重点说明 Ready、Available、Unavailable、Updated 等副本状态指标在发布进度跟踪与可用性评估中的作用,并补充 ReplicaSet 的就绪副本、标签一致副本等监控项,用于判断控制器与 Pod 状态是否一致,为告警设计和故障排查提供依据。

2026-02-04 07:00:00 1039

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第二部分)pod、container

本文介绍了Kubernetes中Pod相关的关键监控指标,包括创建时间(kube_pod_created)、启动时间(kube_pod_start_time)和完成时间(kube_pod_completion_time)的时间戳指标,以及Pod基本信息(kube_pod_info)、所有者关系(kube_pod_owner)、所在节点IP(kube_pod_ips)和重启策略(kube_pod_restart_policy)等元数据指标。这些指标通过kube-state-metrics组件采集,包含clus

2026-02-03 07:00:00 709

原创 【mariadb】docker-compose 部署mariadb 主从复制(mariadb:11.5.2)

虽然和mysql大差不差,但是差别就是要踩的坑。

2026-01-29 07:00:00 584

原创 prometheus监控k8s的metric详解(第二版)第二章 kube-state-metrics(第一部分)apiserver、node、namespace、service、endpoint

【代码】prometheus监控k8s的metric详解(第二版)第一章 kube-state-metrics-第一部分-apiserver、node、namespace、service、endpoint。

2026-01-28 07:00:00 1179

原创 Prometheus监控k8s的metric详解(第二版)第一章 scrape 指标抓取

1. `scrape_duration_seconds`1.1 job=kube-state-metrics1.2 job="kubernetes-apiservers"1.3 job="kubernetes-cadvisor"1.4 job="kubernetes-nodes"1.5 job="kubernetes-pods "1.6 job="kubernetes-service-endpoints"1.7 其他job2 `scrape_samples_scraped`3 `scrap

2026-01-27 08:49:28 623

原创 容器启动的mysql主从同步失败问题的快速解决

摘要 本文介绍容器化MySQL主从同步异常的快速修复方案。当从服务器异常关机导致主从不同步时,通过以下步骤解决:1)停止主从容器;2)备份从库data目录后,用主库data目录覆盖从库,并修改auto.cnf文件;3)启动主库并记录master状态;4)从库重新配置主从关系,使用CHANGE MASTER命令指定主库信息。最后验证Slave状态确认同步恢复。该方法适用于不确定同步中断时间点的场景,通过数据全量覆盖实现快速修复。

2026-01-21 14:00:00 177

原创 k8s 平台安装 Kyverno组件完整过程

1. 先决条件2.安装步骤2.1 在线安装2.2 离线安装1)下载chart2)准备镜像3)安装2.3 安装结果3. 测试3.1 创建规则3.2 验证规则

2026-01-21 07:00:00 664

原创 Prometheus报错:expected label name, got “INVALID“

k8s的label不合法造成Prometheus报错:expected label name, got “xxxxx“

2026-01-19 13:30:00 697

原创 K8S的ETCD集群证书详解及应用(etcd节点重建实例、etcd集群更换证书实例)

1. etcd 集群的证书1.1 证书说明1.2 查看证书1)根证书2)对等通信证书(Peer)3)服务端证书(Server)4)健康检查客户端证书(Healthcheck)​1.3 生成证书1)根证书2)其他证书(手动创建)3)kubeadm创建(和手动二选一)2. 【实例1】重建其中一个节点

2026-01-19 07:00:00 657

原创 prometheus监控k8s的metric详解-06-etcd、storage、machine、process

如下边第2条数据表示:“etcd租约对象计数”(即,etcd_lease_object_counts) < 10 的 分布的次数。作用:“etcd中租约对象计数”(每次租约对象数量变化都会进行一个计数)这个操作的计数。

2025-12-11 10:04:11 994

原创 GPU节点接入k8s集群的处理

本文提供了一个在Kubernetes集群中集成和管理NVIDIA GPU节点的实用操作指南。主要内容包括:在Ubuntu节点上离线安装NVIDIA容器运行时工具链,并配置Docker和Containerd以支持GPU容器;安装NVIDIA Fabric Manager和DCGM等高级管理插件以启用完整功能;最后,将准备好的GPU节点加入Kubernetes集群,并通过部署官方的Device Plugin DaemonSet,使集群能够发现、调度和使用GPU计算资源。整个流程涵盖了从系统级配置到Kuberne

2025-12-10 14:00:00 564

openssh-9.3p2升级包(openssh、zlib、openssl)

包含openssh升级到openssh-9.3p2的所有包,其内容如下: - openssh-9.3p2.tar.gz - openssl-1.0.2o.tar.gz - zlib-1.2.11.tar.gz 解决漏洞: - OpenSSH 安全漏洞(CVE-2023-38408) - OpenSSH远程代码执行漏洞(CVE-2024-6387)1 - OpenSSH 安全漏洞(CVE-2023-51767) - OpenSSH 安全漏洞(CVE-2023-51385) - OpenSSH 安全漏洞(CVE-2023-48795) - OpenSSH 安全漏洞(CVE-2023-51384)

2024-07-29

Vue 2.0 路由示例(赤壁之战指挥官查询)

Vue 2.0 路由示例 # 启动方法: - 解压缩文件 - 进入目录 - 执行如下命令 ```shell cnpm install cnpm run dev ``` # 访问: http://127.0.0.1:8000

2022-05-30

nacos.tar.gz

docker-compose 一键启动 nacos服务

2021-08-18

helm.tar.gz

helm v3.5.4

2021-08-13

升级openssh包.zip

升级openssh7.9 资源包

2021-11-03

ttpy-1-6-3.tar.gz

ttpy 1.6.3

2021-08-25

docker-compose_install.tar.gz

docker docker-compose 离线一键部署包(适用 centos 7 )

2021-08-12

chronograf.tar.gz

chart for chronograf

2021-08-17

kapacitor.tar.gz

chart for kapacitor

2021-08-17

pgrouting.sql

pgrouting的初始化sql脚本

2021-08-13

kubeadm_1_15_11.tar.gz

kubeadm_1.15.11 百年证书。本质是一个我自己修改编译的kubeadm二进制文件。 兼容:经测试1.15版本均可用 使用操作流程: 下载----解压缩-----替换原有kubeadm文件----命令行执行更新证书

2021-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除