- 博客(186)
- 资源 (2)
- 收藏
- 关注
原创 openstack rocky版详细搭建
openstack R版搭建文章目录openstack R版搭建作者:40kuai博客:http://www.cnblogs.com/40kuai/个人博客 :http://www.heleicool.cn/有疑问可以加本人QQ:948793841实验环境环境设置安装openstack包数据库安装安装消息队列目前为止端口信息如下开始安装openstack服务keystone服务安装安装配置key...
2018-10-30 16:09:00
18181
23
原创 Python 入门的前十八节课
Python 基础课程 Python【第一课】 Python简介和基础 Python【第二课】 字符串,列表,字典,集合,文件操作 Python【第三课】 函数基础 Python【第四课】 模块 and 包 Python【第四课】 装饰器 Python【第五课】迭代器,生成器,数据序列化 Python【第五课】常用模块学习(待完善) Python【第六课】面向对象...
2017-02-21 09:39:00
391
原创 免费SSL证书的自动续期更新(二)
之前的文章写过一篇对于免费的SSL自动续期的文章,连接在这里:https://blog.csdn.net/u012881331/article/details/153396264然而配置都是通过命令行实现的, 并且需要在各个服务器上独立部署,通过crontab方式来检查证书,对于运维来说维护不友好,最近又发现有些项目把证书申请和部署平台化,通过工作流的形式将流程自动化,非常不错。这里我举例来说明下我所了解到的该类平台。
2025-11-07 14:11:23
261
原创 免费SSL证书的自动续期更新
acme.sh 说明:https://github.com/acmesh-official/acme.sh/wiki/%E8%AF%B4%E6%98%8E。acme.sh 安装参考:https://github.com/acmesh-official/acme.sh/wiki/How-to-install。acme.sh 支持的DNS API: https://github.com/acmesh-official/acme.sh/wiki/dnsapi。一般有两种方式验证: HTTP 和 DNS 验证。
2025-10-16 16:55:34
720
原创 nginx server_tokens 和proxy_hide_header的差别
若想隐藏 Nginx 自身的版本信息(如避免暴露),用。若想隐藏后端服务的技术栈信息(如避免暴露),用。隐藏 Nginx 版本 +隐藏后端服务器的Server头)。
2025-10-16 15:52:35
516
原创 MySQL索引管理
在MySQL中,索引的管理和查看是数据库优化的重要环节,合理的索引管理能显著提升查询性能。(全表扫描)的查询——这些查询可能缺少必要索引,或现有索引不合理(如索引列被函数处理、使用。直接整理数据文件和索引文件的碎片,不会重建表,锁表时间更长(全程加排他锁,读写均阻塞)。)或工具(如Percona Toolkit)识别未使用的索引,及时清理冗余索引。根据业务需求创建不同类型的索引(普通索引、唯一索引、主键索引、联合索引等)。且索引不是主键/唯一键(用于约束),则可能是未使用的索引。
2025-09-25 11:17:56
1367
原创 高效清空文件:truncate
truncate -s 0 example.txt 是 Linux 系统中 “高效清空文件、保留文件本身大文件秒清空、不影响程序写入、安全性更高。下次遇到 “想删内容不删文件” 的需求,直接用它就对了!
2025-09-23 13:56:06
667
原创 云主机网络丢包问题分析
摘要 阿里云ECS监控指标packetInDropRates(虚拟化层)和networkin_droppackages_percent(系统层)都监测丢包但可能存在差异。经分析,packetInDropRates反映底层虚拟化资源问题,而networkin_droppackages_percent基于/proc/net/dev数据。建议重点关注系统级丢包,可通过sar、ifconfig等命令排查。若确认存在丢包,可检查网卡状态、conntrack连接数等,必要时联系云厂商重新调度节点。
2025-09-19 09:54:03
469
原创 容器删除延迟问题处理文档
由于Deployment参数配置不当,导致容器在执行删除操作后,未能立即终止,而是保留了6个小时。为避免资源持续占用,需要执行手动手动强制清理残留容器。表示发送SIGKILL信号(强制终止)若上述命令无输出,说明容器已成功删除。指定kubernetes命名空间,
2025-09-17 17:26:35
329
原创 安装nfs-external-provisioner 构建nfs的storageclasses
如何查看nfs v4 挂载的客户端:https://stackoverflow.com/questions/34919597/how-to-get-the-list-of-clients-connected-to-an-nfs-server-within-a-local-network。
2025-09-16 18:00:56
322
原创 多窗口多烧蚀(Multi-window, Multi-Burn-Rate, MWMBR)
单一窗口的阈值告警很容易“要么太敏感、要么太迟”。用两个窗口、配对的,同时满足才告警:既能大事故,又能,是 SRE Workbook 推荐的最佳实践。
2025-08-14 19:05:42
823
原创 kubernetes中数据存储etcd
维度说明角色k8s 的唯一持久化存储,保存集群所有 API 对象状态存储结构Key-Value,Key 为逻辑路径,Value 为 Protobuf 序列化对象一致性保障Raft 共识,强一致性,顺序提交写入流程关键点API Server → 序列化 → etcd Leader → Raft 复制 → 多数派确认 → 更新 revision → 触发 Watch。
2025-08-14 10:34:46
737
原创 pod 创建过程
在 Kubernetes 中,Pod 的创建是一个多组件协作的过程,涉及 API Server、调度器(Scheduler)、控制器管理器(Controller Manager)、kubelet 等核心组件。整个过程中,API Server 作为“通信中枢”,etcd 作为“数据存储中心”,调度器负责“决策”,kubelet 负责“执行”,各组件通过 watch 机制实时同步状态,确保 Pod 按预期创建和运行。命令、API 调用(如。
2025-08-13 17:40:12
619
原创 Linkerd证书过期
Linkerd默认安装生成的根证书有效期仅365天,容易导致证书过期问题。本文提供了手动更新证书的完整方案:1)使用step工具生成新根证书(可设置更长有效期如10年);2)生成中间CA证书;3)通过linkerd upgrade命令替换证书链。同时介绍了初始安装时直接指定自定义证书的方法,以及验证mTLS是否正常的检查方式。该方案解决了默认证书有效期过短的问题,确保服务网格长期稳定运行。
2025-07-22 17:48:41
201
原创 prometheus relabeling 配置中的防御性编程策略
第二次操作会覆盖第一次的结果,确保使用 Pod 自身的精确名称而非 Endpoint 关联的名称(两者通常相同,但在特殊配置下可能不同)。若 Endpoint 指向 Node 或其他资源,第一次操作会失败(正则不匹配),此时第二次操作可从 Pod 自身的元数据中获取名称。,确保在复杂的 Kubernetes 环境中,无论 Pod 以何种方式被发现,都能正确获取和设置关键标签。先通过 Endpoint 元数据提取(第一次操作),再通过 Pod 自身元数据补充(第二次操作)。进行指标采集是发现个有趣的问题。
2025-07-17 16:55:34
542
原创 victoriametrics Operator 安装
参考:https://docs.victoriametrics.com/operator/quick-start/
2025-07-14 17:04:43
316
原创 VictoriaMetrics 架构
最上层为查询层,一般使用grafana等作为展示,中间层为vms集群, 负责数据的存储、写入和查询。对底层为数据源,一般使用远程写的方式来写入。当然vms还有一些其他组件来完全的替代prometheus+alertmanager的告警流程。vmagent: 从各种来源采集指标,通过remote_write 方式写入到vms或其他时序存储中。这里就不一一赘述了。
2025-07-14 16:48:17
492
原创 Python服务定位CPU打满
摘要:当Python服务CPU满载时,需系统排查计算负载、死循环或资源泄漏等问题。本文提供全链路排查方案:1) 使用top/htop定位高负载线程;2) 添加cProfile/tracemalloc调试参数;3) 采用py-spy生成火焰图或gdb分析堆栈;4) 推荐异步编程、进程池等优化手段;5) 建议集成Prometheus实现长期监控。文中包含十余条实用命令和代码示例,覆盖从快速定位到深度优化的完整处理流程,并附常见问题排查清单。(150字)
2025-06-19 17:41:30
616
原创 ingress-nginx 中GRPC服务延迟配置
通过查询ingress-nginx官方对于grpc超时时间的配置信息,如下:https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/#custom-timeouts。在ingress-nginx中。发现在1.11.0 版本有个更新: https://github.com/kubernetes/ingress-nginx/pull/11258,添加了 grpc 超时注释。支持多种自定义配置。
2025-04-27 14:59:26
1168
2
原创 Nginx的时钟精度陷阱:request_time与upstream_response_time差异分析
在elasticsearch 采集nginx日志分析的场景下发现,小于,于是才有了这边文章在 Nginx 中,和使用不同的系统时钟和精度机制来记录时间,这可能导致。功能特性:CLOCK_MONOTONIC_COARSE 是 Linux 系统的低精度单调时钟,提供毫秒级(默认 4ms 粒度)的时间记录,主要服务于高性能场景(如高频日志记录、网络请求处理)。
2025-03-27 12:07:09
685
原创 kubernetes 日志采集方案 loongcollector(旧名iLogtail)
日志采集使用阿里云开源工具iLogtail,支持部署于物理机,虚拟机,Kubernetes等多种环境中来采集遥测数据,例如logs、traces和metrics。支持配置远程管理,支持以图形化、SDK、K8s Operator等方式进行配置管理,可轻松管理百万台机器的数据采集。支持多种Logs、Traces、Metrics数据采集,尤其对容器、Kubernetes环境支持非常友好。index的副本为0,当前后端es集群为单点,所以没有必要配置副本。file_and_line:日志文件及行数,方便日志过滤。
2025-02-18 10:49:39
1959
3
原创 云平台 LB(ingress-nginx) 中的HTTP2
在阿里云、AWS等云厂商,如果使用LB方式暴露ingress服务,通常支持在LB层通过注解的方式来配置ALPN策略。在web端可以查看到配置后的信息。在aws中, LB 通过。协商到的则为http2。
2025-02-17 17:07:22
468
2
原创 Nginx 中的HTTP2
AWS 负载均衡器控制器: https://kubernetes-sigs.github.io/aws-load-balancer-controller/v2.2/guide/service/annotations/参数配置参考:https://nginx.org/en/docs/http/ngx_http_v2_module.html。网站验证:https://tools.keycdn.com/http2-test。在nginx 中使用http2,首先需要确认是否安装了。
2025-02-12 20:42:05
583
原创 HTTP/2 由来及特性
2012年,Google提出了SPDY协议,作为HTTP的实验性替代方案,它引入了二进制分帧、多路复用等重要概念,为HTTP/2的发展奠定了基础。经过多年的研究和改进,2015年5月,HTTP/2被互联网工程任务组(IETF)标准化,成为了HTTP协议的下一代版本。随着互联网的发展,网页内容变得越来越复杂,对数据传输的性能和效率提出了更高的要求。为了满足这些需求,各大浏览器厂商和互联网公司迫切需要一种新的HTTP协议来提高网络传输性能,于是HTTP/2应运而生。
2025-02-12 15:54:10
1223
原创 nginx ingress-nginx keep-alive 长连接配置
服务说明请求经过多个中间件的转发,最终pod服务接收到请求。在整个过程中slb和tengine是tcp长连接、tengine和nginx-ingress为http转发(可能存在http短连接)、nginx-ingress和k8s svc为http转发(可能存在http短连接)tengine和nginx-ingress 需要配置http-alive优化频繁的短连接,优化资源和服务响应时间。配置优化当使用nginx作为反向代理时,为了支持长连接,需要做到两点:从client到nginx的连接是长连接.
2025-02-07 16:07:58
2217
原创 Ingress nginx 公开TCP服务
公司业务繁多, HTTP、GRPC、TCP多种协议服务并存,Kubernetes流量入口复杂,所以萌生了通过LoadBalancer + Ingress-nginx 的方式完全的结果入口流量,当然在高并发的场景下可以对LoadBalancer 和Ingress-nginx 进行拆分管理。主要验证下ingres-nginx对TCP流量的转发,以及简单窥探下实现逻辑。最后,修改ingress-nginx deployment , 在启动参数中加入如下配置,用来更新nginx 关于TCP/UDP的转发配置。
2024-11-09 17:18:45
1533
原创 Ingress-nginx中HTTPS的强制转发
参考:https://kubernetes.github.io/ingress-nginx/user-guide/nginx-configuration/annotations/#server-side-https-enforcement-through-redirect。到这里可以看到 配置是没有问题的, 80端口的流量确实是指到了tohttp端口(2443),但这个端口又是什么端口呢。为什么会有这样一个设定呢。这里可以看出,对于2443端口,是强制对访问做了https跳转。
2024-10-16 16:27:37
793
2
原创 Kubernetes:解决命名空间无法正常删除问题 —— 清空 Finalizers 字段的方法步骤
在 Kubernetes 中,有时会遇到命名空间无法正常删除的情况。其中一个可能的原因是命名空间的Finalizers字段阻止了删除操作。
2024-08-28 20:06:35
835
原创 kubedl快速入门
KubeDL(Kubernetes Deep Learning)是一个基于Kubernetes的深度学习训练平台。它旨在简化在Kubernetes集群上运行和管理深度学习训练任务的过程。KubeDL提供了一系列的工具和抽象,使得用户可以更容易地扩展他们的训练作业,利用Kubernetes的资源管理和自动化能力。
2024-08-21 16:12:07
325
原创 VictoriaMetrics 数据的快照与迁移
原始 MergeTree 合并/删除快照链接的部分后,快照开始占用额外空间。因此,不要忘记删除旧快照以释放磁盘空间。VictoriaMetrics 使用硬链接为时间序列数据和倒排索引创建即时快照。有一个命令行标志,包含 VictoriaMetrics 存储数据的文件系统路径。数据恢复会覆盖原有数据,一般情况下不建议使用恢复功能。如果指向已经存在的备份,则执行增量备份。服务,并且只能同类型集群的数据恢复。文件夹中,并将增量每小时备份创建到。创建的备份中恢复数据。将完整的每日备份存储到。
2024-08-16 18:06:34
1900
原创 VictoriaMetrics快速入门
VictoriaMetrics是快速,经济高效且可扩展的时间序列数据库。它可以用作Prometheus的长期远程存储。
2024-08-14 11:57:06
3285
2
原创 redis内存分析
阿里云redis集群对key进行hash后保存在对应的后端节点,使每个节点的key数量大致相同,但是如果存在大key,就会导致单个节点内存用满,可以使用或rdr来对内存进行分析。
2024-07-10 11:41:19
607
原创 10分钟了解KEDA高效弹性伸缩方案
KEDA 的出现主要是为了解决 HPA 无法基于灵活的事件源进行伸缩的这个问题,内置了几十种常见的 Scaler ,可直接跟各种第三方应用对接,比如各种开源和云托管的关系型数据库、时序数据库、文档数据库、键值存储、消息队列、事件总线等,也可以使用 Cron 表达式进行定时自动伸缩,常见的伸缩常见基本都涵盖了,如果发现有不支持的,还可以自己实现一个外部 Scaler 来配合 KEDA 使用。如果业务有周期性的波峰波谷特征,可以使用 KEDA 配置定时伸缩,在波峰来临之前先提前扩容,结束之后再缓慢缩容。
2024-06-05 17:43:42
1536
原创 Linux系统磁盘动态扩容
在日常使用ECS中,时常会遇到有状态服务随着运行时间越来越长,导致数据日积月累越来越多, 磁盘空间也随之紧张,这种情况下对于磁盘容量的动态扩容就显得尤为重要了,尤其来有状态服务运行的情况下。所以当磁盘分区方案为MBR,且磁盘大小需要升级到2TB以上时,就需要先对分区格式进行切换后,对磁盘大小进行无损扩容。使用growpart和resize2fs工具完成Linux系统盘分区扩容及文件系统扩展的操作指导。MBR分区方案支持2TB或更小的磁盘,当磁盘容量超过2T就需要切换为GPT分区表来支持。
2024-03-22 15:10:20
1010
原创 ElasticSearch容器化从0到1实践(三)
上一节说到了ECK落地的26个关键问题,这一节将对这26个关键点的实施进行详细的说明,并给出符合业务的合理建议。另外如果你认真看了上一节提到的26个关键问题,并且也对这些关键点表示认同的话,本节一定要细细品鉴,我自认为可以让你收获巨大。
2023-11-03 16:23:49
375
原创 Chaos Mesh网络延迟原理探索
到这里可以发现Chaos Mesh通过 iptables + tc的方式, 对流量进行拦截后处理。实现网络故障的目录, 其他网络类型故障也是基于该原理实现。参考文档:故障注入源码:https://github.com/chaos-mesh/chaos-mesh/blob/master/pkg/chaosdaemon/tc_server.go#L112。
2023-10-19 17:20:03
552
x-pack-core-6.4.3.jar 破解 下载
2018-12-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅