- 博客(46)
- 资源 (1)
- 收藏
- 关注
原创 链路穿透-运维
链路穿透是一把双刃剑合理使用:提高运维效率,便于问题排查滥用风险:破坏系统架构,引入安全隐患关键在于建立可控、可审计、有限制的穿透机制,在便利性和安全性之间找到平衡点。现代微服务架构中,建议通过服务网格API网关和零信任网络等技术来规范和管理服务间通信。
2025-12-12 10:49:50
381
原创 GitLab
GitLab 是一个雄心勃勃的“All-in-One”解决方案。它始于一个优秀的 Git 托管服务,但已演变为一个旨在覆盖整个 DevOps 生命周期的综合性平台。对于寻求简化工具链、强化安全与合规、并加速软件交付的组织来说,GitLab 是一个非常强大和有吸引力的选择。在一个界面里完成所有工作,让软件交付像流水线一样顺畅、自动、可控。
2025-12-10 10:58:43
933
原创 Nexus(Sonatype Nexus Repository Manager)
对于运维工程师而言,Nexus 是企业IT基础设施中承上启下的“供应链核心”。它向上对接开发和CI流程,保障构建的“原材料”(依赖)供应;向下对接CD和部署流程,提供高质量的“产成品”(制品)。维护好Nexus的稳定性、安全性和性能,是保障整个DevOps流水线顺畅运行的关键。
2025-12-10 10:13:57
1131
原创 BES MQ 和 BES WebServer
BES MQ是系统的“神经网络”和“缓冲器”,负责不同服务间可靠、高效的数据通信。是应用的“托管家园”和“执行单元”,负责让您的应用程序代码能够轻松、稳定、弹性地运行起来。两者都是构建现代化、高可用、可扩展的云应用不可或缺的核心云服务。选择BES意味着你可以获得百度在搜索、推荐等海量业务中锤炼出来的中间件和基础设施技术。
2025-12-04 09:38:27
1012
原创 PodDisruptionBudget(PDB)
用于选择受保护的 Pod 的标签选择器。通常与你的 Deployment 或 StatefulSet 的 selector 一致。约束条件(二选一):必须保持可用的 Pod 的最小数量。可以是绝对数(如2)或百分比(如"50%":允许不可用的 Pod 的最大数量。同样可以是绝对数或百分比。和只能使用其中一个。PodDisruptionBudget 是 Kubernetes 生产环境中保证应用高可用性的一个至关重要的"安全阀"。
2025-11-27 11:02:44
503
原创 VirtualService
VirtualService 是 Istio 服务网格的“流量指挥官”。智能路由:金丝雀发布、A/B测试。故障恢复:超时、重试、熔断。流量切分:基于内容(头部、URI等)的精确路由。它将流量治理能力从应用代码中下沉到基础设施层,是实现现代化、可观测、高可用的微服务架构的基石。
2025-11-27 10:20:38
852
原创 Zabbix
至此,您已经完成了:Zabbix Server、Web 前端和数据库的安装与配置。在 Zabbix Server 本机上安装了 Agent。在另一台服务器上安装了 Agent,并将其添加到 Zabbix 监控中。现在,您可以开始在 Zabbix 强大的 Web 界面上探索监控数据、配置图表、屏幕和复杂的告警规则了。对于 CPU、内存等监控,您链接的已经内置,几分钟后就能看到数据。对于硬盘温度等自定义监控,则需要按照我们之前讨论的方法进行配置。
2025-11-27 10:12:18
987
原创 kubernetes(k8s)-kube-proxy
特性解释身份每个节点上的网络代理和负载均衡器。核心任务实现 Service 的网络抽象,提供稳定的服务发现和负载均衡。沟通对象监听API Server以获取 Service 和 Endpoint 信息。操作对象配置节点的iptables或IPVS规则。关键职责服务发现、流量转发、负载均衡。与 kubelet 区别kubelet管理 Pod 的生命周期(“养马”),kube-proxy管理 Pod 的网络访问(“修路和调度”)。简单来说,
2025-11-26 16:04:49
907
原创 kubernetes(k8s)-kubelet
特性解释身份每个节点上的节点代理,Kubernetes 的“手臂”和“眼睛”。核心任务保障 Pod 处于期望状态。沟通对象与控制平面的API Server通信,与节点的容器运行时交互。关键职责Pod 生命周期管理、健康检查、状态报告、资源监控。特殊能力管理静态 Pod,用于部署控制平面组件。简单来说,没有 kubelet,节点就无法加入 Kubernetes 集群,也无法运行任何工作负载。它是连接宏伟的集群控制平面与具体节点执行层面的关键纽带。
2025-11-26 15:50:07
824
原创 Kubernetes 中的节点亲和性(Node Affinity)
节点亲和性硬亲和性:确保 Pod 运行在符合条件的节点上软亲和性:优化 Pod 的分布和性能丰富表达式:支持复杂的匹配逻辑(IN、NOT IN、EXISTS 等)权重系统:允许设置多个偏好的优先级资源优化(GPU、SSD 等专用硬件)高可用部署(跨区域、跨机架)性能优化(数据本地性、网络拓扑)成本控制(选择合适的实例类型)节点亲和性与污点/容忍、Pod 亲和性/反亲和性一起,构成了 Kubernetes 强大的调度能力体系。
2025-11-24 11:44:14
1419
原创 Kubernetes 中的污点(Taints)和容忍(Tolerations)
污点和容忍污点让节点能够"拒绝"不合适的 Pod容忍让 Pod 能够"接受"特定的节点条件两者结合实现了精细的调度策略和节点资源隔离这个机制在以下场景特别有用:专用硬件节点(GPU、高性能存储)节点维护和故障处理系统组件部署控制多租户环境资源隔离。
2025-11-24 11:25:26
850
原创 SpringBoot
快速启动:几分钟内就能创建可运行的 Spring 应用简化配置:告别繁琐的 XML 配置生产就绪:内置监控、健康检查等生产特性微服务首选:是现代微服务架构的理想基础框架生态丰富:与各种技术(如 Dubbo、Redis、Elasticsearch)无缝集成Spring Boot 的出现极大地推动了 Java 企业级开发的发展,让开发者能够更专注于业务逻辑而非框架配置,是目前 Java 领域最主流和应用最广泛的框架之一。
2025-11-24 10:49:54
1439
原创 Dubbo
Dubbo是 Java 领域构建高性能分布式服务(微服务)的基石型框架。它通过 RPC、服务注册与发现、负载均衡等核心机制,解决了分布式系统中服务之间可靠、高效通信的关键问题,是互联网公司,尤其是中大型企业构建后端系统的首选技术之一。
2025-11-24 09:55:43
944
原创 Golang基本语法、案例
这份指南涵盖了 Go 语言的核心概念和实用技巧,建议通过实际编码来巩固理解。:net/http, encoding/json, io, os 等。:goroutine 和 channel 是语言核心特性。:构建 CLI 工具、Web API、微服务等。:Gin, Echo, GORM 等流行框架。:掌握 testing 包和表格驱动测试。,支持并发安全操作和自动清理过期数据。:语法简洁,编译速度快。:一次编写,到处编译。
2025-11-18 16:22:59
567
原创 云原生技术-服务网格(Service Mesh)
用于将外部服务(非 Kubernetes 托管的服务)集成到 Istio 的服务网格中,使其能够像内部服务一样被管理和监控。服务网格是现代微服务架构的关键基础设施,Istio作为其中的代表性项目,提供了完整的企业级服务网格解决方案。,它构建在容器编排平台(如Kubernetes)之上,为微服务架构提供可靠、安全、快速的通信能力。主要组件:Istiod(Istio)、Linkerd(控制平面)等。)的流量进行细粒度控制,特别是定义服务的不同版本(子集):熔断、重试、超时、故障注入。
2025-11-18 15:13:41
1021
原创 Kubernetes 的包管理工具——Helm
安装一个 Chart 时,Helm 会结合你的配置参数,将 Chart 中的模板渲染成真正的 Kubernetes YAML 文件,并将其提交给 API Server,从而在集群中创建出具体的资源(如 Pod, Service 等)。同一个 Chart 可以被安装多次,每次安装都会生成一个独立的 Release。:一个 Helm 软件包,包含了在 Kubernetes 上运行一个应用所需的所有资源定义。:你可以从公共的或私有的 Repository 中查找、下载和上传 Chart。用户可以在安装时通过。
2025-11-18 14:15:22
722
原创 RocketMQ
特性描述适用场景金融级数据一致性强大的事务消息和同步双写机制交易、支付、账务等核心系统强顺序保证基于 MessageQueue 的局部顺序消息证券交易、Binlog同步丰富的消息类型顺序、事务、定时/延迟、广播消息复杂的业务场景高可用性多 Master-多 Slave 架构,数据多副本对服务 SLA 要求高的场景海量消息堆积高性能的本地文件存储,支持万亿级消息堆积大数据、日志类场景中国特色由阿里巴巴发起,在国内有丰富的实践和生态国内企业,尤其是金融、电商行业。
2025-11-13 14:26:19
846
原创 RabbitMQ
成熟稳定:经过多年企业级应用验证灵活的路由:多种交换器类型满足复杂路由需求管理界面:提供功能丰富的Web管理界面多语言支持:支持几乎所有主流编程语言集群支持:支持高可用集群部署插件生态:丰富的插件扩展功能适用场景:RabbitMQ 特别适合需要复杂路由、企业级可靠性、较低延迟的消息场景,如微服务通信、任务队列、RPC调用等。不适用场景:需要处理海量日志数据、需要消息回溯、吞吐量要求极高的场景可能更适合Kafka。
2025-11-13 11:21:28
1109
原创 Kafka
特性描述解决的问题高吞吐量通过分区、顺序IO、批处理实现海量数据处理可扩展性轻松添加 Broker 和分区系统增长需求持久性消息持久化到磁盘,可配置保留策略数据不丢失,可重放低延迟生产消费延迟通常在毫秒级实时性要求高的场景高并发支持数千个客户端同时连接微服务架构下的多生产者/消费者简单来说,Kafka 是一个强大的“数据中枢神经系统”,它以极高的效率接收、存储和分发数据流,使得构建实时、可扩展、容错的流数据处理架构成为可能。从传统的日志聚合到现代的事件驱动微服务,它都是不可或缺的基础设施。
2025-11-13 11:07:02
784
原创 ZooKeeper
特性ZooKeeperNacos核心定位分布式协调器(CP)服务发现与配置中心(AP/CP 可切换)数据模型树形文件结构 (Znode)Key-Value / 服务实例列表一致性强一致性(CP),基于ZAB协议默认高可用(AP),基于Raft协议(用于配置)和自研协议(用于服务)健康检查客户端TCP心跳客户端上报/服务端检查(TCP/HTTP/MySQL)主要场景分布式锁、领导者选举、集群状态管理服务发现、动态配置、流量管理易用性需要自己封装逻辑,API相对底层。
2025-11-13 10:11:00
994
原创 nacos
Nacos 这个名字来源于ming andervice,即。它由阿里巴巴开发并开源,现在是套件中的核心组件之一。和。:启动时,会向 Nacos 服务器自己的信息,比如服务名、IP地址、端口号等。:启动时,会从 Nacos 服务器自己关心的服务。Nacos 会将健康的服务提供者列表推送给消费者。:服务的唯一标识,消费者通过服务名来调用服务,而不是具体的IP和端口。这是实现服务间解耦的关键。:Nacos 会定期检查注册的服务实例是否健康(如心跳检测)。
2025-11-13 09:25:11
749
原创 nginx安装配置、故障处置、性能优化
性能优化检查清单✅ 调整工作进程数和连接数✅ 启用 sendfile、tcp_nopush、tcp_nodelay✅ 配置合理的缓冲区大小✅ 启用 Gzip 压缩✅ 设置静态资源缓存✅ 优化反向代理配置✅ 配置操作系统参数✅ 实施安全加固措施✅ 设置监控和日志分析✅ 定期进行压力测试通过系统化的配置、监控和优化,Nginx 可以轻松应对高并发场景,提供稳定高效的服务。
2025-11-12 16:59:25
542
原创 kubernetes(k8s)-扩缩容(工作负载HPA、节点)
除了 CPU/内存,HPA 还支持基于自定义指标(如 QPS - 每秒请求数)进行扩缩容。这通常需要Prometheus和。示例 HPA 配置(基于 QPS)metadata:spec:metrics:- type: Pods # 基于 Pod 的指标pods:metric:name: http_requests_per_second # 自定义指标名称target:averageValue: 100 # 目标:每个 Pod 平均处理 100 QPS扩缩容类型控制对象主要依据适用场景。
2025-11-12 16:39:00
1677
原创 kubernetes(k8s)-pv、pvc
特性角色集群资源(如“硬盘”)用户请求(如“申请单”)创建者集群管理员 / StorageClass(动态)应用开发者 / StatefulSet目的提供存储消费存储关注点底层存储细节(NFS, EBS 等)存储需求(大小、访问模式)核心价值解耦:将存储的供应与使用分离,开发者无需关心底层存储实现。自动化:通过实现动态配置,极大简化了存储管理。持久化:为有状态应用提供了可靠的数据持久化方案,是运行数据库、中间件等关键服务的基础。
2025-11-12 16:12:29
1022
原创 kubernetes(k8s)-Service
特性ClusterIPNodePort访问范围集群内部集群外部(通过 NodeIP)互联网(通过云LB)IP类型集群内虚拟 IP集群内虚拟 IP + 节点 IP集群内虚拟 IP + 节点 IP + 云外部 IP适用场景微服务内部通信开发、测试、简单外部访问云上生产环境依赖kube-proxykube-proxy, 节点网络kube-proxy, 节点网络, 云提供商Service 是 Kubernetes 服务发现的基石。
2025-11-12 13:47:37
1243
原创 kubernetes(k8s)-pod生命周期
相位和状态让你能快速判断 Pod 的整体健康状况。重启策略定义了容器失败后的恢复行为。生命周期回调让你有机会在容器启动和关闭时执行自定义逻辑,实现优雅启停。容器探针是 Kubernetes 的“眼睛”,它通过存活探针确保应用实例的可用性,通过就绪探针确保流量的正确路由,通过启动探针保护慢启动应用。合理配置这些机制,是构建健壮、可观测、自愈的云原生应用的基础。
2025-11-12 10:18:49
1361
原创 kubernetes(k8s)扩缩容(弹性伸缩)
如果增加Pod数量后,节点资源使用率上升到一定程度,继续扩容出来的Pod无法调度,则可以根据节点资源使用率继续伸缩节点数量。通常情况下,两者需要配合使用,因为HPA需要集群有足够的资源才能扩容成功,当集群资源不够时需要CA。,如果每时每刻都要保持能够扛住高峰流量的机器数目,那么成本会很高。,使得集群有足够资源;而当HPA缩容后集群会有大量空余资源,这时需要CA。,达到资源使用上限后可能会导致应用出现异常。当使用Pod/容器部署应用时,通常会设置容器的。释放资源,才不至于造成浪费。,以避免在流量高峰期。
2025-10-24 14:43:11
247
原创 AI全栈工程师
美国:open AI ChatGPT(当家扛把子,被别人追赶的对象)、Microsoft Copilot、Google Bard。大模型:全称“大语言模型”,large language mode,缩写LLM。中国:deepseek、百度文心一言、讯飞星火、智谱清言...AGI时代最重要的人:懂AI、懂编程、懂业务的超级个体。如果不能访问ChatGPT,不是ChatGPT Plus会员,会非常遗憾。Copilot是ChatGPT免费平替,用的也是宇宙最强GPT-大模型。AI:机器学习、神经网络。
2025-10-20 16:27:53
167
原创 运维工程师面试题积累
SRE: 这是核心理念和方法论。SRE(站点可靠性工程)由Google提出,旨在通过软件工程的方式解决传统的运维问题,其核心目标是在保证服务可靠性的前提下,追求高效的迭代速度。Linux: 这是基石。工作重心从维护物理服务器转移到在云平台上构建和管理可扩展、高可用的服务。一句话总结:一个使用软件工程方法和自动化工具,在Linux和云计算平台上,构建并维护大规模、高可用软件系统的工程师。高级: 高级/资深SRE工程师、SRE技术负责人、架构师。中级: SRE工程师 / DevOps工程师。
2025-10-20 11:11:49
412
原创 kubernetes(k8s):控制器-Deployment、StatefulSet、DaemonSet、job、cronjob
StatefulSet,常用于部署有状态的且需要有序启动的应用程序。Kubernetes 的 StatefulSet 是专为管理有状态应用设计的控制器,通过提供稳定的网络标识持久化存储及,解决了有状态应用在集群化部署中的核心痛点。第一个应用完成启动后,才会启动第二个应用,依此类推。
2025-10-17 15:14:40
682
原创 linux学习笔记 第3课
执行ping命令 会使用ICMP传输协议,发出要求回应的信息,若远程主机的网络功能没有问题,就会回应该信息,因而得知主机运作正常。su 用户 表示切换用户,但是环境变量保持现在的用户的环境变量。ps:查看在计算机系统中,有哪些程序正在执行及其执行的情况。shutdown -r 11:30 等到11:30进行重启。它和ps类似,不过,它会几秒钟更新一次系统状态,方便追踪。在默认的情况下,wc将计算指定文件的行数、字数,以及字节数。若要显示一整年的年历,可以在cal命令后加4位数的年份。
2024-08-06 16:03:13
1318
原创 Linux学习笔记 第2课
这个指令只有是由系统管理者(root)所使用,一般使用者没有权限可以改变别人的文件拥有者,也没有权限可以把自己的文件拥有者改设为别人。<这个命令不会删除tar文件,但会把解除归档的内容复制到当前工作目录下,并保留归档文件所使用的任何目录结构。chmod文件的使用者(u,g,o)增减(+添加权限,-去掉权限,=重新赋值)权限名称(r,w,x)文件。-f 计算行数时,以实际上的行数,而非自动换行过后的行数(有些单行字数太长的会被扩展为两行或两行以上)默认设置,它只查看文件的前10行。
2024-08-06 15:54:36
1577
原创 Linux学习笔记 第1课
切换到root用户下:1.Linux系统特征:一切都是文件;每个文件都有自己确定的用途;多用户多任务的操作系统;开源,免费2.Linux系统版本:开发版(次版本号为奇数)、稳定版(次版本号为偶数)主版本号、次版本号、修订次数3.centos环境的搭建4.Linux中常见的目录结构FHS标准(Filesystem Hierarchy Sta
2024-08-01 16:42:46
1385
axits2-1.7.7
2017-12-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅