- 博客(441)
- 资源 (9)
- 收藏
- 关注
原创 MHA架构实施(一主一从)学不会,你来打我?加油!奥利给
目录1、环境要求2、架构工作原理2.1架构介绍:2.2 MHA软件构成3、Mysql环境搭建3.1环境准备(主从都需要下面步骤)3.2用户的创建处理原始环境3.3解压文件,更改文件目录3.4设置环境变量3.5环境目录规划3.6my.cnf配置文件3.7mysql数据库初始化3.8启动数据库2种方式1. sys-v2. systemd3.9修改数据库的密码4、mysql主从配置1、主库创建用户(db01)2、从库开启连接(db0.
2020-06-24 11:43:46
4275
3
原创 用 Skills 驱动 AI 开发:Matt Pocock 工作流在 DevOps 场景里的落地实践
AI编程助手在实际工程中的工作流优化 摘要:AI编程助手在实际开发中常面临需求不清、代码不可运行、Bug修复困难等问题。Matt Pocock提出的"skills"工作流通过将开发过程拆分为小而可组合的技能模块(如需求澄清用/grill-me,任务拆分用/to-issues等),有效解决了这些问题。该工作流强调:1)拷问先于建造,确保需求对齐;2)建立共享术语和架构决策记录;3)采用垂直切片式任务拆分;4)严格的红绿重构开发流程;5)问题分类优先于直接诊断。这套方法特别适用于DevOps、Kubernete
2026-05-18 17:07:06
704
原创 Claude.md实战案例分享
本文介绍了一个适用于Linux和Windows环境的开发者配置方案,重点针对全栈工程师在TypeScript、Python和Go项目中的开发规范。配置强调安全优先、最小改动原则和简单性设计,包含代码风格、Git策略、验证流程等详细规则。特别注重跨平台兼容性,要求根据运行环境自动适配命令和路径格式。配置还制定了严格的提交规范、环境识别方法和服务进程管理策略,确保开发过程的可维护性和一致性。所有规则按"必须"、"优先"、"默认"三个等级划分,当冲突时以
2026-05-14 14:58:25
112
原创 把 Claude 变成团队工程师:项目级配置与全局约束实践
本文探讨了如何通过项目级配置提升AI编程助手的工作稳定性。文章指出,仅依靠临时Prompt会导致AI行为不一致,建议将项目规则、技术栈约束等沉淀为配置文件。推荐的项目目录结构包含CLAUDE.md主规则文件、本地偏好配置、hooks脚本等模块。核心配置原则包括:将CLAUDE.md写成可执行的行为约束而非愿景文档;强调简单性原则和手术式修改;明确Windows环境下的特殊要求;为不同技术栈制定局部规则。通过这种配置方法,可使AI助手像团队成员一样遵循统一的工程规范,减少随机行为,提高协作效率。
2026-05-14 14:39:36
475
原创 从创建到进化:用 skill-creator 和 Darwin 打造高质量 Agent Skill
文章摘要: Agent Skill生态快速发展,工具如Claude Code、Codex等开始支持SKILL.md扩展机制。随着Skill数量增长,手工管理变得困难,需要系统化的工作流。文章介绍了skill-creator和darwin-skill工具链:前者用于从零创建Skill,后者用于持续优化Skill质量。Skill本质是给AI的操作说明书,包含核心说明、脚本和资源。文章以创建CSDN作者信息读取Skill为例,展示了完整开发流程,包括定义边界、设计工作流、编写脚本和结构化输出。强调Skill开发不
2026-05-11 12:25:37
786
原创 从 Prompt 到工程化能力:写好 AI Agent Skill 的实践方法
摘要:Skill设计核心原则 Skill是面向AI Agent的可执行操作手册,而非人类文档。其核心在于精准定义三要素:触发条件、执行步骤和错误处理。优秀Skill应遵循分层设计原则:L1 frontmatter明确触发场景,L2正文提供核心流程,L3按需加载参考资料。设计时需平衡自由度与确定性,脆弱性任务(如格式校验)应采用脚本严格约束,开放性任务(如代码审查)则保留AI灵活性。关键要避免信息过载,通过模块化设计(scripts/references/assets)实现上下文精准控制,确保AI在有限tok
2026-05-11 10:54:49
599
原创 Hermes Agent 从入门到上手:10分钟搭建你的 AI 智能体平台
最近试用了 Hermes Agent,没想到用起来之后确实有点东西。这篇文章就把我从安装到上手的完整过程记录下来,希望能帮你少走点弯路。
2026-04-29 21:40:44
1112
原创 Obsidian + Claude Code + LLM Wiki:基于Karpathy 构建你的智能第二大脑完整指南
**LLM Wiki** 提供了新的范式:让 AI 增量构建和维护一个持久化的 Wiki(互相链接的 Markdown 文件)。知识被"编译"一次,然后持续更新,形成**可复利的数字资产**。本文将带你完整搭建一个基于 **Obsidian + Claude Code + LLM Wiki** 的智能第二大脑,
2026-04-18 15:44:52
3716
原创 Claude Code国内优化完全指南:Win零成本打造丝滑AI编程体验
作为一个折腾了无数次AI编程工具的Windows用户,我算是摸透了Claude Code在国内的各种坑:要么原生Windows版本功能砍半,要么官方API要翻墙还死贵,中文理解又拉胯,好多好用的插件还装不上。踩了半个月的坑终于整出一套完美的国内优化方案,从免登录配置、模型接入到插件推荐全给你整明白,不用xxx,免费额度够你用到爽,体验直接拉满。
2026-03-26 18:01:49
993
原创 LLaMA-Factory 给 Qwen1.5 做 LoRA 微调 实战
这篇文章不追求“最简单能跑通”,而是按生产视角把流程写成一个可复用的 runbook: 用 **LLaMA-Factory** 基于 **Qwen1.5-1.8B-Chat** 做 **LoRA SFT**,把“你是谁?”的回答稳定改成:> 我是 Archer,由 南宫乘风 研发。
2026-03-20 14:56:10
513
原创 Qwen2.5-7B 指令(LoRA)微调完整实战指南
本文介绍了如何利用LoRA指令微调技术构建专属智能运维助手。基于24GB显存的A30显卡环境,详细展示了从数据准备到模型部署的全流程:首先将原始运维工单JSON数据转换为指令微调格式,然后使用QLoRA方案在Qwen2.5-7B模型上进行微调,包括4bit量化配置、LoRA参数设置等关键步骤。文章提供了完整的训练脚本和参数配置,特别适合中小规模运维场景的定制化AI助手开发,可实现对历史工单数据的智能分析和解决方案生成。
2026-03-19 16:07:00
1030
原创 从零开发AI诊断Agent:拆解LLM+Tools+Prompt三大核心
不知道你有没有这种感觉——现在用 Claude Code 这类 AI 工具时,总觉得它像变魔术一样。你丢一个问题进去,它就能自动定位代码 bug、修改文件、甚至操作服务器。前阵子我做了一个 MySQL 诊断 Agent,用户只需要敲一行命令,它就能自己查慢查询、看系统负载、分析锁等待,最后给你一份完整的诊断报告。
2026-03-16 23:39:56
601
3
原创 Claude Code 从 0 到 1 实战全攻略:掌握下一代编程 Agent 的核心能力
摘要: Claude Code是一款强大的AI编程助手,支持代码生成、终端命令执行、多模态交互等丰富功能。本文详细介绍了其环境搭建、交互模式切换、权限管理等基础操作,并深入解析了复杂任务处理、MCP协议实现UI精准还原、上下文管理等高级功能。通过Hook自动化、Agent Skill定制、SubAgent独立任务处理等扩展功能,开发者可将其从基础工具升级为高效生产力平台。文章还以待办应用开发为例,展示了从需求分析到技术栈选型的实战流程,帮助开发者全面掌握Claude Code的应用技巧。
2026-02-07 14:46:49
1469
原创 Loki 日志采集落地:从单机 Helm 部署到 Promtail 采集与 Grafana 查询
本文介绍了在生产环境中使用Grafana Loki搭建轻量级日志系统的实践方法。Loki通过仅索引标签而非日志内容的设计,显著降低了资源消耗和运维复杂度。文章详细讲解了Loki的核心优势、适用场景及数据流架构(GLP:Grafana+Loki+Promtail),并提供了Helm部署Loki、Grafana配置及Promtail采集日志的具体步骤。重点包括:单机模式Loki的快速部署、LogQL查询语法、虚拟机日志采集配置,以及生产环境中的权限管理和服务化部署建议。这套方案特别适合需要稳定运行、成本可控且主
2026-02-04 17:17:29
1191
原创 Kubernetes 网络问题排查:在宿主机对 Pod 抓包(nsenter + tcpdump 实战)
摘要: 本文介绍如何在不修改容器镜像的情况下,通过宿主机进入Pod网络命名空间(netns)进行抓包排障。利用nsenter工具结合Pod沙箱容器的PID,可直接在宿主机执行tcpdump捕获Pod的真实流量。文章详解了定位节点、获取PID、抓包操作的全流程,并提供了常用过滤表达式、文件滚动策略及典型场景(如DNS异常、TCP重传)的分析方法。该方法无需侵入容器,适合精简镜像或只读文件系统的生产环境,帮助快速诊断网络超时、连接失败等问题。
2026-02-03 14:47:27
982
原创 镜像扫描报告里“系统漏洞”和“应用漏洞”,到底该怎么修?
摘要:镜像漏洞应分为系统漏洞(OS包)和应用漏洞(依赖组件),并采取不同修复策略。系统漏洞可通过升级基础镜像、OS包或精简运行时层解决;应用漏洞需升级版本或重建产物。建议建立分流处置流程,区分漏洞状态和影响,制定基线、门禁和例外管理机制,将漏洞治理从救火转为流水线作业。关键步骤包括分层分类、定期升级基线、多阶段构建及可控例外管理,最终实现可持续的漏洞修复闭环。(150字)
2026-01-29 11:49:23
666
原创 Kubernetes 中如何避免僵尸进程:从原理到 tini 落地实践
本文探讨了容器和Kubernetes环境中僵尸进程的危害及解决方案。僵尸进程会占用有限的PID资源,导致节点不稳定。由于容器内的PID 1通常不是传统init进程,无法回收子进程,使问题更严重。文章分析了Linux进程回收机制,提出三类Kubernetes解决方案:共享进程命名空间、使用轻量init(如tini/dumb-init)作为PID 1,以及运行时层启用init。其中推荐在生产环境中使用tini/dumb-init方案,既能回收僵尸进程,又能正确处理信号。最后提供了验证僵尸进程的方法和落地建议,强
2026-01-24 20:05:12
770
原创 Kubernetes 中 ConfigMap 和 Secret 热更新:Reloader 实战指南
本文介绍了Kubernetes配置热更新的解决方案Reloader。它解决了ConfigMap/Secret更新后应用不自动加载的问题,通过监听配置变更并触发关联工作负载的滚动更新来实现配置生效。文章详细分析了env注入与volume挂载的差异,提供了Reloader的三种使用策略:自动更新、匹配更新和指定资源更新,并通过Nginx示例演示了配置变更触发滚动更新的完整流程。最佳实践建议根据业务场景选择合适的更新策略,对于不支持热加载的应用推荐使用Reloader实现配置更新。
2026-01-23 17:03:34
821
原创 企业级 Helm 通用 Chart 项目实战指南
本文介绍了一种通用化Helm Chart设计方案,用于解决Kubernetes微服务部署中的重复配置问题。通过抽象公共逻辑和参数化差异点,构建了一个"通用超级Chart",开发者只需通过values.yaml声明服务差异即可自动生成标准部署配置。方案包含核心架构设计、目录结构优化和values.yaml详细配置模板,支持镜像、副本、资源限制、健康检查等通用微服务配置项。该设计显著提升了部署效率,实现了"一次定义,多处复用",有效避免了传统YAML管理方式带来的维护碎片
2026-01-21 11:17:53
628
原创 Helm实战指南:从零到一掌握Kubernetes包管理工具
Helm 是 Kubernetes 的包管理工具,解决了传统部署方式的痛点:硬编码参数、版本管理困难和共享不便。文章介绍了 Helm 的核心概念(Chart、Repository、Release),并通过实战演示了 Nginx 应用的完整生命周期管理,包括安装、升级、回滚和卸载。还展示了如何创建自定义 Chart,包括编写模板文件和配置 values.yaml。Helm 通过模板化和参数化,简化了 Kubernetes 应用的部署和管理,提高了运维效率。
2026-01-20 16:14:58
883
原创 Kubernetes 本地存储实战:Open-Local 从部署到生产级应用
摘要:Open-Local云原生本地存储解决方案 Open-Local是阿里云开源的Kubernetes本地存储管理系统,旨在解决云原生环境下有状态应用对高性能存储的需求。该系统通过LVM和裸设备两种方式管理本地磁盘,提供动态分配、扩容、快照等企业级存储功能。Open-Local包含四大组件:调度扩展器(Scheduler-Extender)、CSI插件、节点代理(Agent)和控制管理器(Controller),支持创建存储池、IO限流和监控等特性。相比传统网络存储方案,Open-Local显著降低了延迟
2025-12-31 16:08:41
775
原创 Kubernetes集群智能巡检-定位问题
本文介绍了一个Kubernetes智能巡检工具的Bash实现方案,针对生产环境中常见的K8S集群故障排查痛点进行了优化。该工具具有以下特点: 提供8大检查模块,涵盖从基础设施到应用层的全栈检查 内置智能诊断逻辑,能自动关联不同层级的故障 支持故障优先级排序和健康评分系统 输出详细的检查报告,包括颜色标记的状态信息 工具采用Bash脚本实现,依赖kubectl命令,可选jq进行高级处理。通过实际案例展示了该工具能有效解决故障定位慢、影响面不清、信息分散等运维痛点。脚本包含预检查、状态检查、事件分析等功能模块,
2025-11-21 19:03:30
871
原创 基于 Flask + APScheduler + MySQL 的自动报表系统设计
本文介绍了一个基于Flask的轻量级自动报表系统,实现了定时生成邮件报表的功能。系统采用模块化设计,包含API服务器(数据接收)、MySQL数据库(数据存储)和定时调度器(报表生成发送)三大核心模块。外部任务通过HTTP POST上报JSON格式数据,API服务验证后通过ORM存入数据库。系统配置采用.env文件管理,支持数据库连接和邮件服务器设置。关键代码包括数据模型定义(TaskReport)、报表生成逻辑和邮件发送功能,实现了任务执行数据的收集、存储和分析,并能在指定时间自动生成HTML格式报表通过S
2025-10-30 22:18:59
1272
原创 检索增强生成(RAG)全流程解析
大模型构建与优化方法解析 摘要:本文系统阐述了大语言模型构建的六步法,包括数据采集、预处理、模型设计、预训练、调整优化和评估测试,奠定模型能力基础;提出三大优化路径(提示词工程、微调、RAG)以释放模型潜能,其中RAG通过检索外部知识库增强生成效果,能有效解决知识时效性、专业性和幻觉问题。文章详细剖析了RAG的核心原理与实施架构,包括离线知识库构建(文档解析、分块、向量化)和在线问答推理(问题理解、检索、重排序)两大阶段,为企业AI落地提供关键技术方案。
2025-09-29 20:55:15
1120
原创 统一日志格式规范与 Filebeat+Logstash 实践落地
在多部门、多技术栈并存的企业环境中,日志收集与分析是保障系统稳定运行的核心能力之一。然而,不同开发团队采用各异的日志打印方式,导致日志数据结构混乱,严重影响后续的收集、存储、检索与告警效率。本文将介绍我们如何建立统一的日志格式规范,并基于 Filebeat + Logstash 实现多环境(宿主机/Kubernetes)下的高效日志采集、解析与存储。
2025-07-16 18:16:11
1369
原创 利用 Nginx 实现灰度环境的 H5 应用发布策略
在现代互联网应用开发中,灰度发布(又称金丝雀发布)是一种非常重要的部署策略。它允许我们将新版本服务逐步推送给部分用户,而不是一次性全量发布,从而降低风险并快速获得用户反馈。本文将分享一个实际的灰度环境部署案例,涉及两个服务(fbdm和grayfbdm)共享同一数据库但运行不同代码的场景。
2025-06-18 18:15:08
1216
原创 基于Nginx的微信支付回调跨网络环境解决方案
在企业项目开发与测试过程中,我们经常会遇到微信支付这类 必须公网可访问 的第三方服务需要回调我们的应用接口的问题。但许多项目部署在 内网环境,公网服务无法直接访问,尤其在上下游开发或测试环境中,这个限制尤为突出。本文将介绍解决公网微信回调无法访问内网服务的问题,并保证接口路由的灵活性和安全性。
2025-06-11 18:24:16
1510
原创 为MySQL社区版实现审计功能:从插件配置到日志监控全解析
本文探讨了MySQL社区版缺乏原生审计功能的问题,并提出使用MariaDB的server_audit插件作为解决方案。介绍了版本兼容性关键点(MySQL 5.7.34及以下版本适用),详细说明了插件安装步骤和配置参数优化建议,包括日志路径设置、文件轮转策略等。文章还展示了审计日志的格式样例,为需要合规审计的企业提供了可行方案。最后强调在生产环境部署前必须进行完整测试,确保插件兼容性和稳定性。
2025-06-10 11:12:48
1306
原创 基于阿里云DashScope API构建智能对话指南
本文介绍了如何基于阿里云DashScope API构建企业级智能客服系统。项目核心需求包括多轮自然语言对话、低延迟流式响应、工具调用能力和稳定部署。技术选型上,DashScope因其模型多样性、API兼容性、性能保障和成本效益脱颖而出。文章详细展示了基础对话功能的实现代码,并进一步优化了
2025-05-22 18:40:54
1306
1
原创 Chroma向量检索实战:打造智能客服的“最强大脑”
向量库(Vector Database)是一种专门设计用来存储和检索向量数据的数据库系统。在这个文件中使用的ChromaDB就是一种向量数据库。向量嵌入(Embeddings) :将文本、图像等非结构化数据转换为高维数字向量相似性搜索 :基于向量间的距离(如余弦相似度)快速查找相似内容高效索引 :使用特殊的索引结构(如HNSW)加速相似性搜索。
2025-04-28 18:17:57
1467
原创 Harbor2.0仓库镜像清理策略
这些历史镜像如果不及时清理,会占用大量的存储空间,导致 Harbor 仓库膨胀,影响系统性能。在策略页面,点击“编辑”按钮,配置策略的执行时间。-配置并执行镜像清理策略后,镜像的元数据会被删除,但实际的存储空间不会立即释放。目前 公司的Harbor存储已经占用1T,好多的repo的镜像tag达到上百多,没有清理十分占用空间。:多个策略可能存在冲突,Harbor 按照策略的创建顺序依次执行,建议合理规划策略的优先级。在策略页面,点击“立即执行”按钮,可以手动触发策略,立即清理符合条件的镜像。
2025-04-27 18:38:51
2400
原创 Python使用FastMCP开发MCP服务端
Model Context Protocol (MCP) 是一个专门为 LLM(大语言模型)应用设计的协议,它允许你构建服务器以安全、标准化的方式向 LLM 应用程序公开数据和功能。FastMCP 作为 Python 生态中的一款轻量级框架,利用装饰器来简化路由与工具函数的开发,帮助开发者快速构建面向工具的服务端应用。1. Tool(工具)Tool 允许服务器公开可执行的函数,这些函数可由客户端调用并由 LLM 使用来执行操作。
2025-04-15 18:08:00
5061
原创 基于Go语言和Kubernetes的多集群管理平台开发实践
client-go是kubernetes官方提供的go语言的客户端库,go应用使用该库可以访问kubernetes的API Server,这样我们就能通过编程来对kubernetes资源进行增删改查操作;除了提供丰富的API用于操作kubernetes资源,client-go还为controller和operator提供了重要支持client-go的informer机制可以将controller关注的资源变化及时带给此controller,使controller能够及时响应变化。
2025-03-26 15:11:01
1539
原创 使用Vue CLI从零搭建企业级项目实战(Vue3+全家桶)
一篇关于 Vue3 项目搭建的博客文章。下面的示例包含了以下内容:- 使用 Vue CLI 创建项目- 安装并使用 axios 进行 API 请求- 配置 vue-router 实现路由跳转- 全局引入 ant-design-vue 组件库
2025-03-10 15:37:46
734
原创 Gin框架从入门到实战:核心用法与最佳实践
Gin 凭借其高性能和简洁设计,成为 Go 语言 Web 开发的首选框架。本文从基础用法到高级特性,覆盖了路由、中间件、参数绑定等核心内容。掌握这些技能后,可尝试结合 gRPC、Swagger 等工具构建企业级应用。
2025-03-04 11:07:28
1149
原创 实战复盘:如何用JProfiler在30分钟内解决内存泄漏?
通过JProfiler分析Dump文件,开发者可以快速定位内存泄漏或大对象问题。生成准确的快照:确保JVM参数配置正确。掌握分析工具的核心功能:如引用链追踪、大对象筛选。结合代码与业务场景:避免“治标不治本”的临时修复。
2025-02-24 17:13:37
2795
原创 轻量级日志分析利器:Go实战
log-analyzer 是一个轻量级、实用的日志分析工具,它以简洁的代码实现了核心的日志分析功能,能够有效提升开发者和测试人员的日常工作效率。后续根据公司需求添加更多的功能。
2025-02-17 16:48:49
1463
原创 Kubernetes Pod扩容预热陷阱:如何避免5xx错误和CPU飙升?
等到第二次再去启动的时候,JVM就可以去读取刚刚所记录的这些方法编译的信息,同时会主动的触发即时编译器编译刚刚记录的热点方法,使得在用户请求到来之前,就把热点方法编译成为性能较高的Native Code,避免了在用户请求大量进入的时候做编译,这样就能够进一步提高应用程序的性能,节约CPU使用率。因此,每次扩展服务时,都会丢失数据或者会导致这部分请求的响应时间增加。在慢启动模式下,添加新的目标服务Pod时,避免新增Pod被大量请求击垮,这些新目标服务可以根据指定的加速期在接受其均衡策略的请求之前进行预热。
2025-02-06 15:23:02
1757
原创 Zabbix监控山特UPS电源:实现高效监控与告警
近期,随着机房迁移的进行,为了提升电力保障并确保设备的持续运行,我们在原有基础上新增了多台山特UPS电源作为备用电源。这些UPS电源的主要作用是在电力中断时为机房设备提供足够的电力支持,确保设备有充足的时间进行正常关机,避免由于突然断电带来的数据丢失或硬件损坏。然而,UPS电源本身并未进行有效的监控,这使得我们无法实时掌握UPS的工作状态、电池电量等关键信息,从而错失可能出现故障的早期预警。因此,为了提高机房电力管理的智能化水平,确保UPS电源的稳定性与可靠性,我们决定对这些UPS电源进行全面的监控。通过
2025-01-20 16:28:12
1833
2
原创 Flask 与 SocketIO 正确初始化及最佳实践调试
我使用Flask和Flask-SocketIO 来做 Websocket 链接。前期正常使用,但是后期布置修改什么导致Websocket连接失败。排查需求,才发现初始化不正常导致。在postman输入地址和监听事件。
2024-12-30 18:02:10
728
XSS剖析(让你认识到xss的危害和防范)
2019-01-03
MHA实施文档.pdf
2020-06-24
python爬虫软件
2019-01-03
zabbix4.2.4.zip(包含win版本)
2020-05-09
MHA实施文档.zip
2020-06-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅