- 博客(53)
- 收藏
- 关注
原创 Prompt、Agent、Skill、MCP 到底是啥?用一家饭馆的后厨给你讲透
这两年 AI 圈的名词,更新速度简直比前端框架发版本还快:Prompt、Agent、Skill、MCP、Workflow、Memory……一个接一个往外冒。很多朋友一边看文章一边点头,心里其实已经开始犯嘀咕:这几个词到底有啥区别?是不是都在换着 法子说同一件事?本文直接借一家饭馆后厨的故事,把这几个概念一次讲清
2026-04-03 17:45:22
338
原创 aiops初体验:让 AI 接管告警分析,这个小 Agent 到底能干啥?
最近这段时间,AIOps 这个词在技术圈里越来越常见,很多朋友都在聊:AI 到底能不能真正帮线上排障?笔者最近抓耳挠腮的想要将运维的实际场景结合ai,做了一个小的demo,代码量不大,但把一个 AIOps Agent 的最小闭环已经串起来了。本文就和大家一起拆一拆这个项目:它的代码结构是什么、每个文件负责什么、整个执行链路怎 么跑,以及这套思路放到真实线上场景里还有哪些坑。
2026-04-02 10:29:43
186
原创 大模型到底是啥?运维人10分钟搞懂(不用数学)
很多人以为大模型很玄、很难,其实本质没那么复杂。本文用运维视角,把大模型拆成“下一词预测 + 注意力机制 + 三阶段训练”,不讲公式,只讲你能用得上的原理。看完你就能判断:什么时候该用大模型,怎么用,值不值得上。
2026-03-24 11:47:49
218
原创 Token 烧钱?OpenClaw 这几个配置让我省了一半开销
AI agent 好用,但跑起来 token 消耗真的肉疼。笔者用 OpenClaw 跑了一段时间之后,摸索出了几个实际有效的省 token 姿势,拿出来给老哥们参考——不是什么玄学调优,都是能直接落地的配置改动。
2026-03-20 18:10:01
357
原创 OpenClaw生产级部署指南:权限隔离、流量管控、用量追踪全方案
不少朋友装完OpenClaw爽是爽,但总担心两个问题:1)权限太大,万一哪天AI抽风执行rm -rf /*,硬盘直接原地升天;2)多模型切换用起来没数,一觉醒来token账单三位数。这篇我把自己踩了N个坑总结的OpenClaw安全管控方案全分享: 容器化部署隔离权限、IP白名单控制面板访问、token用量告警、 行为日志全追溯,所有配置代码直接复制就能用,自托管玩家必看!
2026-03-18 10:50:59
406
原创 LiteLLM + OpenClaw:多模型 API Key 管理与模型切换实战
当同时使用多个大模型厂商时,API Key 管理与模型切换会变得复杂。本文通过 LiteLLM 构建统一的大模型代理服务,并将其接入 OpenClaw,实现多模型统一管理与动态切换。同时结合 Docker 和 PostgreSQL,实现 Token 使用情况监控
2026-03-10 10:24:28
269
原创 让 AI 住进飞书:OpenClaw 接入飞书机器人的完整实践
在上一篇文章成功部署 OpenClaw 之后,接下来我们让 AI 真正“走进工作流”——接入飞书机器人。本文记录了完整的接入流程,包括飞书应用创建、权限配置、OpenClaw Feishu 插件启用、Pairing 配对机制以及群聊模式配置。最终实现通过飞书私聊或群聊即可与 AI 助手对话。
2026-03-06 10:25:16
401
原创 openclaw喂饭教程!在 Linux 环境下快速完成安装、初始化与 Web UI 配置
OpenClaw 是一款开源的 AI Agent 工具,但对第一次接触的用户来说,完整跑通流程并不直观。本文以 Linux 环境为例,详细记录了 OpenClaw 的安装、初始化流程、模型选择、TUI 使用方式,以及 TUI 与 Web UI 认证不一致导致的常见问题与解决方法,帮助你最快速度把 OpenClaw 真正跑起来
2026-03-05 14:45:52
1201
原创 老年人记不住命令?ShellGPT 是你的终端外挂
ShellGPT = 命令行 × AI。无需记忆复杂参数,一句话生成精准命令;无需手动解析输出,管道直接丢给 AI 分析。本文详解安装配置、模型选择(白嫖阿里云)、三种使用模式(简洁/交互/会话),以及 netstat、kubectl、git 等实战场景。适合所有想在终端里"偷懒"的开发者和运维。
2026-03-02 10:35:28
665
原创 Istio 流量治理实战:镜像、超时重试、熔断与限流,一次讲透
本文围绕 Istio 在真实生产场景中的流量治理能力展开,从流量镜像、超时与重试策略,到熔断与连接池限流,逐一结合配置示例与实测日志进行验证。通过实际请求与时间间隔分析,深入理解 istio-proxy 的重试退避机制及其潜在风险,帮助你在高并发场景下更稳、更可控地使用 Istio
2026-02-09 14:34:35
672
原创 istio流量分发实战:从配置到踩坑全解析
本文通过一个真实的 Istio 流量分发案例,系统梳理按比例、按 Header、按 URL 前缀等常见路由方式,并重点分析 Host 不匹配导致流量失效的根因。结合 Nginx 与 Sidecar 共存场景,详细说明金丝雀、灰度、蓝绿及 A/B 测试在 Istio 中的落地方式,适合正在或即将引入 Istio 的工程实践参考
2026-02-04 15:03:52
655
原创 istio初探以及解决http-426的问题
在之前的文章中,我们花了大量的篇幅,从记录后端pod真实ip开始说起,然后引入envoy,再解决了各种各样的需求:配置自动重载、流量劫持、sidecar自动注入,到envoy的各种能力:熔断、流控、分流、透明代理、可观测性等等,已经可以支撑起一个完整的服务治理框架了而今天介绍的istio,正是前面提到的这些所有功能的集大成者,从本文开始,我们将详细介绍istio,并且与之前手搓的功能做一个详细的对比,为大家以后选择服务治理的某个功能提供参考。
2026-01-29 11:19:13
1098
1
原创 Envoy 可观测性实战:日志、指标与链路追踪的完整落地
可观测性不是“装个 Prometheus 就完事”,而是日志、指标、链路追踪三位一体的系统工程。本文结合 Envoy 1.32 实际配置,详细讲解如何接入 Prometheus 和 Jaeger,以及 Envoy Admin 接口在观测中的作用,帮助你快速建立一套真正“能用”的 Envoy 可观测性方案
2026-01-26 11:02:27
299
原创 不止是代理:Envoy 在微服务中的熔断、限流与流量治理实战
在服务网格和云原生架构中,Envoy 早已不只是“转发请求”的组件。本文通过熔断、限流、流量分发和透明代理等能力,逐步揭示 Envoy 如何将流量控制前移到基础设施层,从而避免级联故障、支撑灰度发布,并为后续的可观测性与服务治理打下基础
2026-01-13 11:02:40
374
原创 从手动到自动:基于 Mutating Admission Webhook 实现 Envoy Sidecar 自动注入
在微服务规模不断扩大的场景下,手动为每个 Pod 注入 Envoy Sidecar 已经难以维护。本文从实际工程问题出发,详细讲解如何利用 Kubernetes 的 Mutating Admission Webhook 机制,实现 Envoy Sidecar 的自动注入。内容涵盖证书生成、Webhook 配置、注入服务实现,以及基于 Namespace / Pod Label 的精细化注入控制
2026-01-05 11:00:13
755
原创 Nginx 零改造:在 Kubernetes 中用 iptables 劫持流量到 Envoy Sidecar
如果你不想让业务团队为 Sidecar 改任何配置,那你就只能从更底层下手。本文通过一个真实的 Kubernetes + Envoy 场景,展示了如何在 业务零感知 的情况下,利用 iptables 强行“接管”Nginx 的出入流量。过程中不仅有完整命令和验证思路,还有真实踩坑:端口冲突、uid 相同导致规则失效、pid namespace 带来的副作用——每一个问题,都是 Sidecar 落地时绕不开的现实。
2025-12-31 10:01:30
318
原创 很多人用 Envoy,却从没真正理解过 xDS(我也是,直到手搓了一遍)
xDS 看起来配置复杂、概念一堆,但真正跑一遍之后你会发现:它解决的,只是“配置修改如何自动生效”这个最朴素的问题。本文通过手写 EDS / RDS / ADS,把 Envoy 的动态服务发现从配置文件,拆解成一条清晰、可验证的工程链路。
2025-12-29 11:02:56
601
原创 envoy使用consul做服务发现
上一篇内容,我们详细讨论了怎么使用envoy做负载均衡,并且记录详细的地址,其中还解决了一个问题,那就是怎么让envoy获取真实后端pod ip地址,后面使用headless service,既使用了service的服务发现能力,又不使用service的负载均衡能力如果在某些特殊的场景下完全放弃的k8s service(比如混合云部署机房,两边云都需要有相同的服务,但是服务之间不能跨云访问),怎么赋予envoy服务发现的能力。
2025-12-24 10:20:24
425
原创 追踪链路--使用envoy来记录后端pod真实ip
之前使用了iptables、ipvs,在数据包的必经之路(POSTROUTING)上拦截并且记录日志,本文使用一个比较成熟的组件envoy来记录后端pod的真实ip。
2025-12-22 11:07:36
378
1
原创 追踪链路--使用iptables/ipvs来记录后端pod真实ip
之前使用nginx-ingress-controller来记录后端真实ip,但是有位老哥说了,我没有用nginx-ingress-controller,而是用的原生nginx,这时候又当如何记录后端真实ip的问题呢。
2025-12-17 10:23:21
444
4
原创 链路追踪--使用nginx-ingress-controller记录后端pod真实ip
本文展示如何使用nginx-ingress-controller来记录后端pod真实ip
2025-12-08 11:36:24
782
原创 6年前的项目终于更新了--机房ping监控全国主要城市
当初项目的本意是为了监测中心机房到全国各地(主要是省会与重要城市)的ping速率而创建,目标ip地址是根据某个ip网站爬取,而现在该网站已经下线了,导致目标ip无法获取,再加上所用组件版本已经年久失修,最后是本人懒惰~~,导致项目已经不可用很久了今年勤奋战胜懒惰,又重新占领高地,想着把该项目重修修缮一遍。
2025-11-27 10:40:24
320
原创 opentelemetry全链路初探--日志跳转trace
上一小节描述了metrics、traces,本小节来把log也加进去,并且做一个traces与log的联动当查看日志的时候,可以同时跳转到对应的jaeger,查看分段trace情况。
2025-11-20 11:08:19
389
原创 opentelemetry全链路初探--jaeger架构拆分
jaeger的架构演变在之前的描述中,一直使用jaeger:all-in-one来做数据存储与展示,jaeger:all-in-one就是将collector、query、ui、storage等等功能的大杂烩,在调试与测试环境中,非常方便,但是在生产环境肯定是不能这样用,本节就来 将其拆分成对应的子模块。
2025-11-18 10:43:14
450
原创 opentelemetry全链路初探--python注入
经过上一节,opentelemetry的基本操作都已经融会贯通,但是有位老哥提出疑问?我的代码都已经写完了,为了添加全链路,还需要重构之前的代码吗?那这个代价太大了。那本章就来讨论一下opentelemetry的注入的问题本小节主要关注python注入。
2025-11-12 10:47:52
447
原创 opentelemetry全链路初探--埋点与jaeger
某天一位业务研发老哥跑来咨询研发老哥:我的服务出现了504,但是不太清楚是哪个环节报错,每次请求需要访问4个微服务、2个数据库、1个redis、1个消息队列。。。苦逼运维:停停停,不要再说了,目前不支持链路追踪,只能手动帮你一个服务一个服务的排查了先请老哥大概描述了一下业务逻辑以及访问方式,10分钟过去了。再逐级排查每个服务以及对应访问的资源层,终于在半小时之后完成了故障定位。。。这效率也太低了,于是,关于链路建设项目提上了议程,目标只有一个,快速定位问题,提高稳定性。
2025-11-10 11:11:13
417
原创 彩笔运维勇闯机器学习--梯度下降法
本文系统介绍了梯度下降法的数学原理与应用。首先从导数、偏导数等基础概念入手,详细解释了梯度的定义及其在多元函数优化中的意义。然后重点阐述了梯度下降法的核心思想:通过沿负梯度方向迭代调整参数,逐步逼近函数最小值点。文章以一元线性回归为例,展示了梯度下降法的具体计算过程,包括损失函数计算、梯度求解和参数更新步骤。最后指出该方法相比最小二乘法具有更广泛的适用性,可用于各种回归和分类模型。全文通过数学公式和图示相结合的方式,清晰呈现了梯度下降法的理论基础和实现细节。
2025-09-17 11:15:59
638
原创 彩笔运维勇闯机器学习--随机森林
随机森林的出现,是为了解决决策树对训练数据过拟合的问题而出现的。决策树在训练的工程中,可以让每一个叶子节点的不确定性降为0
2025-09-11 14:52:17
318
原创 彩笔运维勇闯机器学习--决策树
决策树是一种常用的机器学习模型,用于分类和回归任务,它通过模拟“树”的结构来对数据进行决策。本节我们详细讨论的是决策树中的分类任务
2025-09-09 11:12:00
1114
原创 彩笔运维勇闯机器学习--逻辑回归
从本节开始,我们的机器学习之旅进入了下一个篇章。之前讨论的是回归算法,回归算法主要用于预测数据。而本节讨论的是分类问题,简而言之就是按照规则将数据分类
2025-09-03 14:15:19
865
原创 彩笔运维勇闯机器学习--多项式回归
在之前的讨论中,讨论的都是线性回归,自变量与结果可以通过一条直线来解释。而今天讨论的问题,自变量与结果可能需要曲线来拟合
2025-08-25 10:23:53
410
原创 彩笔运维勇闯机器学习--多元线性回归(实战)
书接上文,上一小节简单介绍了多元回归的基本原理、使用方式,本小节来实践:qps与cpu、内存、磁盘io、网络io之间的关系
2025-08-20 14:52:29
1083
原创 彩笔运维勇闯机器学习--多元线性回归
之前讨论了一元线性回归,主要是qps与cpu的关系,但是现实中cpu只是系统指标的一部分,还有内存、io、网络等等,本小节就来讨论一下,通过多个系统参数对于qps的影响
2025-08-18 10:15:11
343
原创 彩笔运维勇闯机器学习--cpu与qps的线性关系
书接上文,上一小节简单介绍了一元回归的基本原理、使用方式,作为运维,实践才是最重要的,那本小节就来实践一下我们之前的话题:探索cpu与qps的关系
2025-08-14 10:40:10
868
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅