40kuai-CSDN博客

原创 openstack rocky版详细搭建

openstack R版搭建文章目录openstack R版搭建作者：40kuai博客：http://www.cnblogs.com/40kuai/个人博客：http://www.heleicool.cn/有疑问可以加本人QQ：948793841实验环境环境设置安装openstack包数据库安装安装消息队列目前为止端口信息如下开始安装openstack服务keystone服务安装安装配置key...

2018-10-30 16:09:00 18181 23

原创 Python 入门的前十八节课

Python 基础课程 Python【第一课】 Python简介和基础 Python【第二课】字符串，列表，字典，集合，文件操作 Python【第三课】函数基础 Python【第四课】模块 and 包 Python【第四课】装饰器 Python【第五课】迭代器，生成器，数据序列化 Python【第五课】常用模块学习(待完善) Python【第六课】面向对象...

2017-02-21 09:39:00 391

原创 Mysql 主从同步

同步原理Mysql 主从复制的流程。

2025-12-25 09:36:59 885

原创 mongo日常操作

【代码】mongo日常操作。

2025-12-04 18:21:42 150

原创免费SSL证书的自动续期更新（二）

之前的文章写过一篇对于免费的SSL自动续期的文章，连接在这里：https://blog.csdn.net/u012881331/article/details/153396264然而配置都是通过命令行实现的，并且需要在各个服务器上独立部署，通过crontab方式来检查证书，对于运维来说维护不友好，最近又发现有些项目把证书申请和部署平台化，通过工作流的形式将流程自动化，非常不错。这里我举例来说明下我所了解到的该类平台。

2025-11-07 14:11:23 261

原创免费SSL证书的自动续期更新

acme.sh 说明：https://github.com/acmesh-official/acme.sh/wiki/%E8%AF%B4%E6%98%8E。acme.sh 安装参考：https://github.com/acmesh-official/acme.sh/wiki/How-to-install。acme.sh 支持的DNS API： https://github.com/acmesh-official/acme.sh/wiki/dnsapi。一般有两种方式验证: HTTP 和 DNS 验证。

2025-10-16 16:55:34 720

原创 nginx server_tokens 和proxy_hide_header的差别

若想隐藏 Nginx 自身的版本信息（如避免暴露），用。若想隐藏后端服务的技术栈信息（如避免暴露），用。隐藏 Nginx 版本 +隐藏后端服务器的Server头）。

2025-10-16 15:52:35 516

原创 MySQL索引管理

在MySQL中，索引的管理和查看是数据库优化的重要环节，合理的索引管理能显著提升查询性能。（全表扫描）的查询——这些查询可能缺少必要索引，或现有索引不合理（如索引列被函数处理、使用。直接整理数据文件和索引文件的碎片，不会重建表，锁表时间更长（全程加排他锁，读写均阻塞）。）或工具（如Percona Toolkit）识别未使用的索引，及时清理冗余索引。根据业务需求创建不同类型的索引（普通索引、唯一索引、主键索引、联合索引等）。且索引不是主键/唯一键（用于约束），则可能是未使用的索引。

2025-09-25 11:17:56 1367

原创高效清空文件：truncate

truncate -s 0 example.txt 是 Linux 系统中 “高效清空文件、保留文件本身大文件秒清空、不影响程序写入、安全性更高。下次遇到 “想删内容不删文件” 的需求，直接用它就对了！

2025-09-23 13:56:06 667

原创云主机网络丢包问题分析

摘要阿里云ECS监控指标packetInDropRates（虚拟化层）和networkin_droppackages_percent（系统层）都监测丢包但可能存在差异。经分析，packetInDropRates反映底层虚拟化资源问题，而networkin_droppackages_percent基于/proc/net/dev数据。建议重点关注系统级丢包，可通过sar、ifconfig等命令排查。若确认存在丢包，可检查网卡状态、conntrack连接数等，必要时联系云厂商重新调度节点。

2025-09-19 09:54:03 469

原创容器删除延迟问题处理文档

由于Deployment参数配置不当，导致容器在执行删除操作后，未能立即终止，而是保留了6个小时。为避免资源持续占用，需要执行手动手动强制清理残留容器。表示发送SIGKILL信号（强制终止）若上述命令无输出，说明容器已成功删除。指定kubernetes命名空间，

2025-09-17 17:26:35 329

原创安装nfs-external-provisioner 构建nfs的storageclasses

如何查看nfs v4 挂载的客户端：https://stackoverflow.com/questions/34919597/how-to-get-the-list-of-clients-connected-to-an-nfs-server-within-a-local-network。

2025-09-16 18:00:56 322

原创多窗口多烧蚀（Multi-window, Multi-Burn-Rate, MWMBR）

单一窗口的阈值告警很容易“要么太敏感、要么太迟”。用两个窗口、配对的，同时满足才告警：既能大事故，又能，是 SRE Workbook 推荐的最佳实践。

2025-08-14 19:05:42 823

原创 kubernetes中数据存储etcd

维度说明角色k8s 的唯一持久化存储，保存集群所有 API 对象状态存储结构Key-Value，Key 为逻辑路径，Value 为 Protobuf 序列化对象一致性保障Raft 共识，强一致性，顺序提交写入流程关键点API Server → 序列化 → etcd Leader → Raft 复制 → 多数派确认 → 更新 revision → 触发 Watch。

2025-08-14 10:34:46 737

原创 pod 创建过程

在 Kubernetes 中，Pod 的创建是一个多组件协作的过程，涉及 API Server、调度器（Scheduler）、控制器管理器（Controller Manager）、kubelet 等核心组件。整个过程中，API Server 作为“通信中枢”，etcd 作为“数据存储中心”，调度器负责“决策”，kubelet 负责“执行”，各组件通过 watch 机制实时同步状态，确保 Pod 按预期创建和运行。命令、API 调用（如。

2025-08-13 17:40:12 619

原创 Linkerd证书过期

Linkerd默认安装生成的根证书有效期仅365天，容易导致证书过期问题。本文提供了手动更新证书的完整方案：1）使用step工具生成新根证书（可设置更长有效期如10年）；2）生成中间CA证书；3）通过linkerd upgrade命令替换证书链。同时介绍了初始安装时直接指定自定义证书的方法，以及验证mTLS是否正常的检查方式。该方案解决了默认证书有效期过短的问题，确保服务网格长期稳定运行。

2025-07-22 17:48:41 201

原创 prometheus relabeling 配置中的防御性编程策略

第二次操作会覆盖第一次的结果，确保使用 Pod 自身的精确名称而非 Endpoint 关联的名称（两者通常相同，但在特殊配置下可能不同）。若 Endpoint 指向 Node 或其他资源，第一次操作会失败（正则不匹配），此时第二次操作可从 Pod 自身的元数据中获取名称。，确保在复杂的 Kubernetes 环境中，无论 Pod 以何种方式被发现，都能正确获取和设置关键标签。先通过 Endpoint 元数据提取（第一次操作），再通过 Pod 自身元数据补充（第二次操作）。进行指标采集是发现个有趣的问题。

2025-07-17 16:55:34 542

原创 victoriametrics Operator 安装

参考：https://docs.victoriametrics.com/operator/quick-start/

2025-07-14 17:04:43 316

原创 VictoriaMetrics 架构

最上层为查询层，一般使用grafana等作为展示，中间层为vms集群，负责数据的存储、写入和查询。对底层为数据源，一般使用远程写的方式来写入。当然vms还有一些其他组件来完全的替代prometheus+alertmanager的告警流程。vmagent: 从各种来源采集指标，通过remote_write 方式写入到vms或其他时序存储中。这里就不一一赘述了。

2025-07-14 16:48:17 492

原创 Python服务定位CPU打满

摘要：当Python服务CPU满载时，需系统排查计算负载、死循环或资源泄漏等问题。本文提供全链路排查方案：1) 使用top/htop定位高负载线程；2) 添加cProfile/tracemalloc调试参数；3) 采用py-spy生成火焰图或gdb分析堆栈；4) 推荐异步编程、进程池等优化手段；5) 建议集成Prometheus实现长期监控。文中包含十余条实用命令和代码示例，覆盖从快速定位到深度优化的完整处理流程，并附常见问题排查清单。（150字）

2025-06-19 17:41:30 616

原创 ingress-nginx 中GRPC服务延迟配置

通过查询ingress-nginx官方对于grpc超时时间的配置信息，如下：https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/#custom-timeouts。在ingress-nginx中。发现在1.11.0 版本有个更新： https://github.com/kubernetes/ingress-nginx/pull/11258，添加了 grpc 超时注释。支持多种自定义配置。

2025-04-27 14:59:26 1168 2

原创 Nginx的时钟精度陷阱：request_time与upstream_response_time差异分析

在elasticsearch 采集nginx日志分析的场景下发现，小于，于是才有了这边文章在 Nginx 中，和使用不同的系统时钟和精度机制来记录时间，这可能导致。功能特性：CLOCK_MONOTONIC_COARSE 是 Linux 系统的低精度单调时钟，提供毫秒级（默认 4ms 粒度）的时间记录，主要服务于高性能场景（如高频日志记录、网络请求处理）。

2025-03-27 12:07:09 685

原创 kubernetes 日志采集方案 loongcollector（旧名iLogtail）

日志采集使用阿里云开源工具iLogtail，支持部署于物理机，虚拟机，Kubernetes等多种环境中来采集遥测数据，例如logs、traces和metrics。支持配置远程管理，支持以图形化、SDK、K8s Operator等方式进行配置管理，可轻松管理百万台机器的数据采集。支持多种Logs、Traces、Metrics数据采集，尤其对容器、Kubernetes环境支持非常友好。index的副本为0，当前后端es集群为单点，所以没有必要配置副本。file_and_line：日志文件及行数，方便日志过滤。

2025-02-18 10:49:39 1959 3

原创云平台 LB（ingress-nginx）中的HTTP2

在阿里云、AWS等云厂商，如果使用LB方式暴露ingress服务，通常支持在LB层通过注解的方式来配置ALPN策略。在web端可以查看到配置后的信息。在aws中， LB 通过。协商到的则为http2。

2025-02-17 17:07:22 468 2

原创 Nginx 中的HTTP2

AWS 负载均衡器控制器： https://kubernetes-sigs.github.io/aws-load-balancer-controller/v2.2/guide/service/annotations/参数配置参考：https://nginx.org/en/docs/http/ngx_http_v2_module.html。网站验证：https://tools.keycdn.com/http2-test。在nginx 中使用http2，首先需要确认是否安装了。

2025-02-12 20:42:05 583

原创 HTTP/2 由来及特性

2012年，Google提出了SPDY协议，作为HTTP的实验性替代方案，它引入了二进制分帧、多路复用等重要概念，为HTTP/2的发展奠定了基础。经过多年的研究和改进，2015年5月，HTTP/2被互联网工程任务组（IETF）标准化，成为了HTTP协议的下一代版本。随着互联网的发展，网页内容变得越来越复杂，对数据传输的性能和效率提出了更高的要求。为了满足这些需求，各大浏览器厂商和互联网公司迫切需要一种新的HTTP协议来提高网络传输性能，于是HTTP/2应运而生。

2025-02-12 15:54:10 1223

原创 nginx ingress-nginx keep-alive 长连接配置

服务说明请求经过多个中间件的转发，最终pod服务接收到请求。在整个过程中slb和tengine是tcp长连接、tengine和nginx-ingress为http转发（可能存在http短连接）、nginx-ingress和k8s svc为http转发（可能存在http短连接）tengine和nginx-ingress 需要配置http-alive优化频繁的短连接，优化资源和服务响应时间。配置优化当使用nginx作为反向代理时，为了支持长连接，需要做到两点：从client到nginx的连接是长连接.

2025-02-07 16:07:58 2217

原创 Ingress nginx 公开TCP服务

公司业务繁多， HTTP、GRPC、TCP多种协议服务并存，Kubernetes流量入口复杂，所以萌生了通过LoadBalancer + Ingress-nginx 的方式完全的结果入口流量，当然在高并发的场景下可以对LoadBalancer 和Ingress-nginx 进行拆分管理。主要验证下ingres-nginx对TCP流量的转发，以及简单窥探下实现逻辑。最后，修改ingress-nginx deployment , 在启动参数中加入如下配置，用来更新nginx 关于TCP/UDP的转发配置。

2024-11-09 17:18:45 1533

原创 Ingress-nginx中HTTPS的强制转发

参考：https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/#server-side-https-enforcement-through-redirect。到这里可以看到配置是没有问题的， 80端口的流量确实是指到了tohttp端口（2443），但这个端口又是什么端口呢。为什么会有这样一个设定呢。这里可以看出，对于2443端口，是强制对访问做了https跳转。

2024-10-16 16:27:37 793 2

原创 Kubernetes：解决命名空间无法正常删除问题 —— 清空 Finalizers 字段的方法步骤

在 Kubernetes 中，有时会遇到命名空间无法正常删除的情况。其中一个可能的原因是命名空间的Finalizers字段阻止了删除操作。

2024-08-28 20:06:35 835

原创 kubedl快速入门

KubeDL（Kubernetes Deep Learning）是一个基于Kubernetes的深度学习训练平台。它旨在简化在Kubernetes集群上运行和管理深度学习训练任务的过程。KubeDL提供了一系列的工具和抽象，使得用户可以更容易地扩展他们的训练作业，利用Kubernetes的资源管理和自动化能力。

2024-08-21 16:12:07 325

原创 VictoriaMetrics 时序数据删除与数据合并

VictoriaMetrics 时序数据的删除与数据合并

2024-08-20 19:53:00 1086

原创 VictoriaMetrics 数据的快照与迁移

原始 MergeTree 合并/删除快照链接的部分后，快照开始占用额外空间。因此，不要忘记删除旧快照以释放磁盘空间。VictoriaMetrics 使用硬链接为时间序列数据和倒排索引创建即时快照。有一个命令行标志，包含 VictoriaMetrics 存储数据的文件系统路径。数据恢复会覆盖原有数据，一般情况下不建议使用恢复功能。如果指向已经存在的备份，则执行增量备份。服务，并且只能同类型集群的数据恢复。文件夹中，并将增量每小时备份创建到。创建的备份中恢复数据。将完整的每日备份存储到。

2024-08-16 18:06:34 1900

原创 VictoriaMetrics快速入门

VictoriaMetrics是快速，经济高效且可扩展的时间序列数据库。它可以用作Prometheus的长期远程存储。

2024-08-14 11:57:06 3285 2

原创 redis内存分析

阿里云redis集群对key进行hash后保存在对应的后端节点，使每个节点的key数量大致相同，但是如果存在大key，就会导致单个节点内存用满，可以使用或rdr来对内存进行分析。

2024-07-10 11:41:19 607

原创 10分钟了解KEDA高效弹性伸缩方案

KEDA 的出现主要是为了解决 HPA 无法基于灵活的事件源进行伸缩的这个问题，内置了几十种常见的 Scaler ，可直接跟各种第三方应用对接，比如各种开源和云托管的关系型数据库、时序数据库、文档数据库、键值存储、消息队列、事件总线等，也可以使用 Cron 表达式进行定时自动伸缩，常见的伸缩常见基本都涵盖了，如果发现有不支持的，还可以自己实现一个外部 Scaler 来配合 KEDA 使用。如果业务有周期性的波峰波谷特征，可以使用 KEDA 配置定时伸缩，在波峰来临之前先提前扩容，结束之后再缓慢缩容。

2024-06-05 17:43:42 1536

java 聊天室

x-pack-core-6.4.3.jar 破解 下载

空空如也

x-pack-core-6.4.3.jar 破解下载