gallonyin-CSDN博客

原创【企业级龙虾】如何正确设置 OpenClaw 的模型上下文

摘要：OpenClaw的contextWindow不应直接设为模型官方最大值，建议设置为70%-90%并预留冗余。4.x版本虽优化统计逻辑，但流式场景下usage缺失问题仍存在。配置策略包括：按模型官方值70%-90%设置、网关层补usage粗算、观察关键指标。特别强调在流式不返回usage时，需通过网关层进行保守估算，确保系统稳定性。推荐使用llm-gateway-lite项目辅助统计，核心原则是"官方上限-安全冗余-真实链路误差"。

2026-04-14 20:58:26 417

原创【企业级龙虾】OpenClaw Skills 动态加载架构深度解析：几百个 Skills 如何可控挂载到上下文

OpenClaw的Skill管理采用分层漏斗机制优化性能与成本：通过多来源发现（workspace/managed/bundled等）、来源内限流（默认200个）、资格过滤（enabled/条件检查）、优先级合并（同名覆盖）和模型挂载预算（150个+30k字符）五层筛选，避免全量加载导致的token爆炸和模型噪音。该架构将技能系统从文件目录问题升级为运行时策略问题，支持动态刷新，并通过源码分析证实其实现细节。开发者可通过拆分目录、调整加载参数和设置skillFilter来优化大规模技能管理。

2026-03-31 18:03:12 523

原创服务器带宽异常排查实战：用 tcpdump + Docker 精准定位“吃带宽”的进程

摘要：针对线上服务器带宽异常问题，提供一套基于Docker和tcpdump的实战排查方案。通过启动netshoot容器抓取宿主机流量（tcpdump -i any），利用grep/awk分析高频IP和端口（如443、53），结合ss/netstat定位进程，最终通过docker命令关联容器。关键步骤包括：抓包→统计→反查→容器定位，形成完整排查链路（带宽异常→抓包→高频端口→进程→容器）。适用于无监控的黑盒场景，尤其应对爬虫、DDOS、死循环等突发流量。附清理日志提醒及进阶优化建议（自动化脚本、Prome

2026-03-24 19:54:31 351

原创【企业级龙虾】WorkTool × OpenClaw 插件集成实战：从回调协议到完整架构设计

OpenClaw-WorkTool集成方案通过插件架构实现企业微信智能体接入，核心设计包括：1）分层架构（通信协议/Agent决策/业务工具分离）；2）去senderId的会话键设计（结合群名/联系人名构造稳定标识）；3）双模式鉴权（webhookToken/robotId兼容不同部署）。该方案通过Webhook桥接WorkTool与OpenClaw，标准化消息处理流程，支持文本/文件收发，形成"捕获→路由→生成→回推"的完整RPA闭环。关键优势在于协议适配层实现多格式兼容，以及轻量网关

2026-03-24 19:52:28 354

原创【企业级龙虾】LLM Gateway 工程化落地：配置中心、429故障转移与统计持久化实战

本文分享了将LLM Gateway Lite项目从本地开发打磨到可开源发布的完整实战经验。文章重点介绍了10个关键改造环节：1）明确网关目标功能；2）本地Docker启动配置；3）管理后台重构；4）配置中心可视化与版本管理；5）链式轮询路由策略实现；6）流式/非流式429故障转移测试；7）统计窗口数据准确性优化；8）统计持久化方案；9）开源前的全面脱敏清理；10）合理的提交策略。作者强调，工程化改造的核心在于确保可观测性、可回滚性和可解释性，同时开源规范需要前置考虑。项目已开源在GitHub，为开发者提供了

2026-03-20 18:30:27 460

原创【企业级龙虾】OpenClaw Bash/SH Wrapper 环境变量持久化

本文介绍了在多租户OpenClaw容器集群中实现环境变量持久化的解决方案。针对200个用户容器存在的环境变量丢失问题，提出了通过init层+shell wrapper实现自动快照回写的方案。该方案在不修改OpenClaw核心代码的前提下，实现了环境变量的自动捕获、增量落盘和重启恢复功能。关键设计包括：启动时加载持久变量、Bash Wrapper自动快照、增量回写避免文件膨胀等。方案通过统一"删除+重建"的运维策略，确保环境变量在容器重建后能正确恢复，使系统行为具备可观测性、可复现性和可恢

2026-03-19 20:28:37 462

原创【AI智能体】Cline核心文件编辑工具分析（replace_in_file）

AI 代码编辑工具核心实现方案摘要：本文介绍 replace_in_file 工具的设计与实现，这是 AI 辅助编程中的关键功能。该工具通过 SEARCH/REPLACE 模式实现代码精确修改，避免重写整个文件。核心内容包括：接口设计：定义清晰的输入输出格式，支持相对/绝对路径，提供详细的错误处理机制 Diff语法规范：采用标准化的 SEARCH/REPLACE 格式，要求完整行匹配（包括缩进和换行符），支持多块有序修改处理流程：包含路径校验、diff解析、精确匹配、内容替换等步骤，确保修改安全可靠

2025-12-21 23:12:24 1269

原创【AI智能体】Claude Code 核心系统提示词深度解析

本文档总结了Claude Code项目中AI工具使用的核心系统提示词设计模式。采用分布式架构，每个Agent、Command和Skill都有独立提示词，但遵循统一设计规范。核心提示词分为四类模式：分析类（识别代码问题）、生成类（创建高质量代码）、验证类（确保代码质量）和编排类（协调复杂任务）。工具使用遵循优先级顺序：专用工具>搜索工具>交互工具>命令执行，强调安全性和语义清晰度。文档还提供了代码审查和代码生成等典型场景的工具组合示例，展示了如何通过结构化提示词指导AI高效完成任务。

2025-12-05 18:13:09 899

原创【AI智能体】打造高内聚的 MCP-Filesystem Server

本文基于Claude Code设计理念，提出一个高内聚、低耦合的MCP-Filesystem Server架构方案。该方案包含6个核心工具：fs_read（安全只读）、fs_write（覆盖写入）、fs_edit（精确修改）、fs_search（合并搜索）、exec（Python执行）和preview_frontend（前端部署）。每个工具职责单一、权限边界清晰，支持多种文件格式自动识别，实现文件操作、代码执行和前端部署三大功能模块。设计遵循"大道至简"原则，工具语义明确且数量合理（6个

2025-12-03 17:18:04 837

原创【AI智能体】Claude Code 工具架构核心解析：大道至简

本文深入解析Anthropic官方AI编程助手Claude Code的工具架构设计。重点剖析了15个核心工具的分层体系，包括文件操作类(Read/Write/Edit等)、执行类(Bash/NotebookEdit等)、交互类(AskUserQuestion等)和信息获取类(WebFetch等)。文章揭示了Claude Code"每个工具都是一个权限边界"的核心设计理念，对比了"仅用Bash"与"权限边界设计"两种方案的优劣，特别强调了Bash工具

2025-12-02 12:09:21 1486

原创【AI智能体】OpenManus 工具调用案例集

本文通过四个案例展示了OpenManus如何利用**工具抽象（Tool Abstraction）**机制，将底层复杂实现封装为LLM可理解的简单函数调用。案例1演示了LLM通过computer_use工具控制远程沙箱GUI，无需了解底层架构；案例2通过crawl4ai工具将网页内容智能清洗为Markdown，避免处理HTML噪音；案例3展示了多智能体协作任务分解与执行；案例4则通过python_execute工具在沙箱中安全执行非受信代码。OpenManus的设计核心是“复杂留给自己，简单留给LLM”，通过

2025-11-21 10:55:51 854

原创【AI智能体】OpenManus项目架构分析报告

本文深入分析了OpenManus项目在AI智能体领域的三大核心设计：1）采用滑动窗口截断和动态Prompt注入的上下文管理策略，有效防止Token溢出；2）基于"共享计划"的多智能体协作机制，通过全局状态维护实现高效解耦；3）构建了包含Python执行沙箱、浏览器操作等核心工具集的MCP生态，并深度集成Daytona虚拟环境实现安全执行。该项目虽完成度有限，但其在动态上下文构建、Token效率优化及工具链抽象等方面的创新设计，为AI智能体工程师提供了有价值的参考范式。

2025-11-21 10:28:02 1006

原创 WorkTool微信消息识别与图片回调技术实现详解

本文详细介绍了WorkTool的微信消息识别与图片处理技术方案。系统采用LCS算法实现99%以上的消息识别准确率，包含消息过滤、智能存储等机制。图片处理方面实现了自动点击、保存、base64转换和网络回调的全流程自动化。技术亮点包括模块化设计、统一接口管理、完善的异常处理和详细的日志系统。该方案已在生产环境稳定运行，支持企业微信自动化、客服系统集成等多种应用场景，具有高精度识别、高效处理和企业级稳定性等特点，为微信自动化提供了可靠的技术支撑。

2025-09-14 17:30:32 1039

原创 FunASR语音识别框架流式识别模型切换

本文对比了流式与非流式语音识别模型的配置差异。非流式组合（含VAD和标点）适合离线音频转写，而流式组合（基础ASR+实时标点）专为低延迟场景设计。关键区别在于：非流式ASR集成VAD/标点模块，处理完整音频；流式标点针对中文实时优化但精度可能降低。部署时需注意流式处理需分块逻辑，且标点模型需与ASR语言匹配。离线场景推荐非流式方案，实时场景应选择流式组合。

2025-08-25 11:34:24 832

原创 FastGPT 超级全局意图识别插件：通用场景轻松识别

在构建智能对话应用时，准确识别用户意图是核心挑战。为了解决输出不可控、准确率低、响应速度慢等问题，本文介绍了一个基于FastGPT的全局意图识别插件。该插件通过简单的JSON配置，支持定义5-10种场景意图，如查酒店、问天气等，适用于多种行业。插件的核心优势在于其高度通用性、配置简便性和快速集成能力。通过预设场景意图和JavaScript代码，插件将用户意图识别转化为选择过程，用户只需回复序号即可快速判断意图。此外，插件仅需LLM输出1个Token，确保了高精准度和快速响应。本文还提供了插件的快速上手指南和

2025-05-10 13:17:23 717

原创 postgresql 重置对应表序列最大值

然后上面虽然一个表搞定了，但我想对所有表都操作一次，那么使用如下脚本，可以在navicat等工具里直接新建查询，粘贴进去执行一下就好了（实测pg17一次解决）。原因是，insert语句如果默认写了id，就不会更新序列的值，需要自己拨一下序列的值…注：这里 _id_seq 你要看是否和自己的数据库一样，一般默认都用的这个。简单来说如下命令就好了，两个your_table 换成你自己的真实表名。当使用pg库备份并恢复时，序列的值很可能不会自动更新到最大ID。

2025-03-29 17:25:35 750

原创增加Swap文件提升ECS云主机可用内存防止OOM

在 Linux 上增加 Swap 内存可以通过以下几种方式实现，具体方法取决于你的需求（如增加 Swap 文件或扩展 Swap 分区）。表示创建 4GB 大小的 Swap 文件，你可以根据需要调整大小。保存并退出后，Swap 文件将在系统重启后自动启用。（CentOS8，增加 Swap 文件为例）：该方案适用于任何情况，操作简单，无需重启。

2025-03-26 11:45:04 397

原创从WorkTool看RPA技术演进——移动端自动化的未来趋势

西安交大提出的两阶段框架，通过视觉解析UI并生成自然语言描述，由LLM拆解任务步骤，在147个真实任务中达到人类水平完成率。：支持鸿蒙/安卓双平台，通过视觉模型+ADB实现跨APP操作（如微信自动回复+小红书评论），任务成功率比单设备方案提升40%。：多Agent协作框架，订座任务中通过“视觉感知-Agent-执行器”链路实现端到端操作，意图理解准确率91%。：港大研发的纯视觉方案，无需后台数据支持，在AndroidWorld基准测试中超越Claude 3.5。

2025-03-12 11:03:17 1438

原创 WorkTool 技术解析：企业微信自动化办公的合规实现方案

随着企业微信用户规模突破4亿（据腾讯2023年财报），其开放生态催生了自动化办公的技术需求。传统RPA（机器人流程自动化）工具在PC端已广泛应用，但移动端自动化仍面临技术合规性、系统兼容性等挑战。本文将探讨基于Android无障碍服务的自动化方案——WorkTool的技术原理与合规边界，为开发者提供实现参考。

2025-03-12 10:37:29 2343

原创免root运行python保活守护进程supervisor

在没有root权限的情况下，仍可以安装和使用 Python 守护进程管理工具（如supervisor保活守护进程）

2025-03-06 15:52:15 1266

原创大模型与图数据库RAG通俗流程拆解

# 模型- 向量化模型 bce-embedding-base_v1- 重排序模型 bce-reranker-base_v1- 大语言模型 Qwen/Qwen2.5-32B-Instruct- 图数据库 tugraph- 索引 faiss# 核心流程这个调用链日志展示了一个完整的问答系统处理用户输入“百草园里有什么”的过程。本项目使用和参考了开源项目[茴香豆](https://github.com/tpoisonooo/HuixiangDou2)。以下是调用链的梳理，确保不遗漏任何步骤

2025-03-03 18:48:48 969

原创排查和解决线程池瓶颈问题案例

日志分析：通过日志分析发现线程池的瓶颈。代码审查：确认@Async注解默认使用的线程池配置。自定义线程池：通过自定义配置增加线程池的线程数，提升并发处理能力。验证效果：通过日志和性能监控验证优化效果。希望这个案例能够帮助大家在遇到类似问题时，快速定位并解决问题。如果你有类似的经验或其他优化方案，欢迎在评论区分享！

2025-02-26 22:27:14 425

原创 1Panel快速轻量应用项目启动最佳实践

在本最佳实践中，我们采用 1Panel + Docker Compose + Cursor 的技术组合来实现快速且可靠的应用部署。

2025-02-22 17:17:22 1677

原创 kvm虚拟机网络桥接和读取ip

检查虚拟机的网络接口是否正确绑定到。在主机上创建桥接网络。

2025-01-07 14:09:46 1213 1

原创 selenium浏览器下载汇总

官网：https://googlechromelabs.github.io/chrome-for-testing/下载chrome win64位：https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.85/win64/chrome-win64.zip。

2024-12-27 15:16:04 784

原创【监控】夜莺监控系统各环节资源压力分析

夜莺监控系统由多个关键组件构成，每个环节都面临不同的资源压力。采集端 Categraf 作为轻量级 agent，内存占用仅 30-50MB，主要压力来自采集频率和指标数量。传输层 Transfer 需要处理大量并发数据，通常消耗 1-2GB 内存，关键在于数据队列处理。索引服务 Index 负责元数据管理，需要 4-8GB 内存支持索引缓存。时序数据库 TSDB 是最消耗资源的组件，通常需要 8GB 以上内存，磁盘 IO 压力很大。告警模块消耗 2-4GB 内存，主要用于规则计算。

2024-12-24 21:11:14 794

原创 Linux Docker环境中解决中文字体乱码问题完整指南

在Linux Docker环境中运行涉及中文显示的应用时（如Selenium网页截图、PDF生成等），经常会遇到中文显示为方块或乱码的问题。这是因为Linux系统默认没有安装中文字体所导致的。我们可以从Windows系统复制常用中文字体到Docker容器中来解决这个问题。

2024-12-16 17:37:05 1822

原创 chromedriver可运行的docker环境

以常见的linux x86服务器为例。

2024-12-12 21:00:21 675

原创 CentOS8或docker镜像centos8更换镜像源

因为 CentOS 8 已经结束生命周期，原来的镜像源不可用了。我们需要将镜像源改为 CentOS 8 的替代源。

2024-12-12 20:46:14 2330

原创 Linux离线安装docker(arm64架构cpu)极速版

之前写过x86版本的快速docker安装部署，现在遇到arm64等架构cpu不适用，主要是因为安装包不通用，因此有这篇文章。cpu测试可以支持鲲鹏cpu或interl arm版本离线安装docker，10分钟极速搞定！亲测适用于CentOS8 及其衍生版本。

2024-11-28 14:29:48 1330

原创快速构建fastapi环境容器

我们经常需要启动一个简单的python网络程序，并提供api端口，下面进行一个简单的Python容器环境制作（依赖列表可按需增减）

2024-11-27 16:01:36 503

原创 dataease一键部署镜像脚本

dataease一键部署镜像脚本仅记录供学习参考，也做备份用一键部署脚本setup.sh。

2024-10-24 10:44:39 622

原创 YOLOv10模型训练深度解析:优化策略与实践心得

在计算机视觉领域,YOLO (You Only Look Once) 系列一直是目标检测的标杆。随着YOLOv10的发布,我们迎来了更强大、更灵活的检测模型。本文将深入探讨YOLOv10的训练过程,分享一些优化策略和实践心得。YOLOv10的训练是一个复杂而有趣的过程。通过精心的数据准备、超参数调优和训练策略优化,我们可以充分发挥这个强大模型的潜力。当然其也有定位，就是适合做图像物体检测任务，而对单标签图像分类任务还是使用其他模型，如efficientnet等。

2024-10-16 17:12:17 1628 1

原创 AI异常检测方案实施-基于基准块的无监督学习

上文讲到AI异常检测的几种方案规划，点击查看由于我们只有“正确答案”，因此当前最符合的做法是使用autoencoder做无监督学习。

2024-09-30 11:31:17 1201

原创 AI异常检测方案规划

后续发布实践方案，敬请关注！

2024-09-30 11:24:35 1389

原创 ollama自定义模型容器部署（cpu版）

使用GPU需要安装 NVIDIA Container Toolkit⁠： https://hub.docker.com/r/ollama/ollama。如果想使用Qwen2.5-7B模型，可以在这个模型页选择适合自己算力需求的模型下载。ollama create #从模型文件创建模型。ollama pull #从注册表中拉取模型。ollama serve #启动ollama。ollama run #运行模型。

2024-09-21 10:55:51 2043

原创 ollama+LLM llama3.1 部署教程（cpu版）

使用GPU需要安装 NVIDIA Container Toolkit⁠： https://hub.docker.com/r/ollama/ollama。有些大佬已经把几乎所有主流开源模型的gguf量化模型都整理好了，比如https://hf-mirror.com/bartowski。如果想使用Qwen2.5-7B模型，可以在这个模型页选择适合自己算力需求的模型下载。ollama create #从模型文件创建模型。ollama serve #启动ollama。

2024-09-20 10:22:21 859

原创 FunASR搭建语音识别服务和VAD检测

该服务使用阿里达摩院的模型，并支持SSL连接、2pass模式以及语音热词处理。你还需要从阿里云上下载相关的语音识别模型、VAD模型、标点符号模型等。这些模型是由达摩院发布的，具体的模型目录稍后会在启动命令中给出。这样，你的VAD模型将在600毫秒后检测到结束静音，适用于需要更快速响应的语音识别场景。的VAD参数，你可以根据具体需求定制VAD的检测灵敏度和时长。这些参数控制了VAD的静音检测、语音与噪音之间的比率等。这里需要确保你的客户端主机和端口设置正确，并且使用的是2pass模式。

2024-09-10 20:53:30 7098 3

原创使用Python写一个适用于Dify和FastGPT的JsonPath插件

通过上述步骤，我们实现了一个简单但功能强大的 JsonPath 插件，适用于 Dify 和 FastGPT。它可以处理 JSONPath 查询、正则表达式提取以及 JavaScript 沙盒执行等任务。希望这篇文章能帮助你更好地理解如何构建类似的插件，并将其应用到你的项目中。如果你有任何问题或建议，欢迎在评论区留言讨论。

2024-08-31 09:43:39 1738

原创在 Docker 中配置 npm 和 pnpm 使用镜像源

在 Docker 中构建前端应用时，使用 npm 或 pnpm 安装依赖是必不可少的步骤。为了解决这个问题，我们可以配置 npm 和 pnpm 使用国内的淘宝镜像源。在 Docker 中构建 Node.js 应用时，配置 npm 和 pnpm 使用国内的镜像源，可以显著提高依赖安装的速度和稳定性。通过这些配置，你将能够在网络环境受限的情况下，依然快速、高效地构建你的前端应用。如果你需要绕过网络限制，可以通过设置代理服务器的方式来强制 npm 和 pnpm 请求通过代理。，这是由于锁定文件或缓存的影响。

2024-08-30 17:26:43 6251

IconWorkshopshiyongban

空空如也