自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 资源 (1)
  • 收藏
  • 关注

原创 【企业级龙虾】如何正确设置 OpenClaw 的模型上下文

摘要:OpenClaw的contextWindow不应直接设为模型官方最大值,建议设置为70%-90%并预留冗余。4.x版本虽优化统计逻辑,但流式场景下usage缺失问题仍存在。配置策略包括:按模型官方值70%-90%设置、网关层补usage粗算、观察关键指标。特别强调在流式不返回usage时,需通过网关层进行保守估算,确保系统稳定性。推荐使用llm-gateway-lite项目辅助统计,核心原则是"官方上限-安全冗余-真实链路误差"。

2026-04-14 20:58:26 417

原创 【企业级龙虾】OpenClaw Skills 动态加载架构深度解析:几百个 Skills 如何可控挂载到上下文

OpenClaw的Skill管理采用分层漏斗机制优化性能与成本:通过多来源发现(workspace/managed/bundled等)、来源内限流(默认200个)、资格过滤(enabled/条件检查)、优先级合并(同名覆盖)和模型挂载预算(150个+30k字符)五层筛选,避免全量加载导致的token爆炸和模型噪音。该架构将技能系统从文件目录问题升级为运行时策略问题,支持动态刷新,并通过源码分析证实其实现细节。开发者可通过拆分目录、调整加载参数和设置skillFilter来优化大规模技能管理。

2026-03-31 18:03:12 523

原创 服务器带宽异常排查实战:用 tcpdump + Docker 精准定位“吃带宽”的进程

摘要: 针对线上服务器带宽异常问题,提供一套基于Docker和tcpdump的实战排查方案。通过启动netshoot容器抓取宿主机流量(tcpdump -i any),利用grep/awk分析高频IP和端口(如443、53),结合ss/netstat定位进程,最终通过docker命令关联容器。关键步骤包括:抓包→统计→反查→容器定位,形成完整排查链路(带宽异常→抓包→高频端口→进程→容器)。适用于无监控的黑盒场景,尤其应对爬虫、DDOS、死循环等突发流量。附清理日志提醒及进阶优化建议(自动化脚本、Prome

2026-03-24 19:54:31 351

原创 【企业级龙虾】WorkTool × OpenClaw 插件集成实战:从回调协议到完整架构设计

OpenClaw-WorkTool集成方案通过插件架构实现企业微信智能体接入,核心设计包括:1)分层架构(通信协议/Agent决策/业务工具分离);2)去senderId的会话键设计(结合群名/联系人名构造稳定标识);3)双模式鉴权(webhookToken/robotId兼容不同部署)。该方案通过Webhook桥接WorkTool与OpenClaw,标准化消息处理流程,支持文本/文件收发,形成"捕获→路由→生成→回推"的完整RPA闭环。关键优势在于协议适配层实现多格式兼容,以及轻量网关

2026-03-24 19:52:28 354

原创 【企业级龙虾】LLM Gateway 工程化落地:配置中心、429故障转移与统计持久化实战

本文分享了将LLM Gateway Lite项目从本地开发打磨到可开源发布的完整实战经验。文章重点介绍了10个关键改造环节:1)明确网关目标功能;2)本地Docker启动配置;3)管理后台重构;4)配置中心可视化与版本管理;5)链式轮询路由策略实现;6)流式/非流式429故障转移测试;7)统计窗口数据准确性优化;8)统计持久化方案;9)开源前的全面脱敏清理;10)合理的提交策略。作者强调,工程化改造的核心在于确保可观测性、可回滚性和可解释性,同时开源规范需要前置考虑。项目已开源在GitHub,为开发者提供了

2026-03-20 18:30:27 460

原创 【企业级龙虾】OpenClaw Bash/SH Wrapper 环境变量持久化

本文介绍了在多租户OpenClaw容器集群中实现环境变量持久化的解决方案。针对200个用户容器存在的环境变量丢失问题,提出了通过init层+shell wrapper实现自动快照回写的方案。该方案在不修改OpenClaw核心代码的前提下,实现了环境变量的自动捕获、增量落盘和重启恢复功能。关键设计包括:启动时加载持久变量、Bash Wrapper自动快照、增量回写避免文件膨胀等。方案通过统一"删除+重建"的运维策略,确保环境变量在容器重建后能正确恢复,使系统行为具备可观测性、可复现性和可恢

2026-03-19 20:28:37 462

原创 【AI智能体】Cline核心文件编辑工具分析(replace_in_file)

AI 代码编辑工具核心实现方案 摘要:本文介绍 replace_in_file 工具的设计与实现,这是 AI 辅助编程中的关键功能。该工具通过 SEARCH/REPLACE 模式实现代码精确修改,避免重写整个文件。核心内容包括: 接口设计:定义清晰的输入输出格式,支持相对/绝对路径,提供详细的错误处理机制 Diff语法规范:采用标准化的 SEARCH/REPLACE 格式,要求完整行匹配(包括缩进和换行符),支持多块有序修改 处理流程:包含路径校验、diff解析、精确匹配、内容替换等步骤,确保修改安全可靠

2025-12-21 23:12:24 1269

原创 【AI智能体】Claude Code 核心系统提示词深度解析

本文档总结了Claude Code项目中AI工具使用的核心系统提示词设计模式。采用分布式架构,每个Agent、Command和Skill都有独立提示词,但遵循统一设计规范。核心提示词分为四类模式:分析类(识别代码问题)、生成类(创建高质量代码)、验证类(确保代码质量)和编排类(协调复杂任务)。工具使用遵循优先级顺序:专用工具>搜索工具>交互工具>命令执行,强调安全性和语义清晰度。文档还提供了代码审查和代码生成等典型场景的工具组合示例,展示了如何通过结构化提示词指导AI高效完成任务。

2025-12-05 18:13:09 899

原创 【AI智能体】打造高内聚的 MCP-Filesystem Server

本文基于Claude Code设计理念,提出一个高内聚、低耦合的MCP-Filesystem Server架构方案。该方案包含6个核心工具:fs_read(安全只读)、fs_write(覆盖写入)、fs_edit(精确修改)、fs_search(合并搜索)、exec(Python执行)和preview_frontend(前端部署)。每个工具职责单一、权限边界清晰,支持多种文件格式自动识别,实现文件操作、代码执行和前端部署三大功能模块。设计遵循"大道至简"原则,工具语义明确且数量合理(6个

2025-12-03 17:18:04 837

原创 【AI智能体】Claude Code 工具架构核心解析:大道至简

本文深入解析Anthropic官方AI编程助手Claude Code的工具架构设计。重点剖析了15个核心工具的分层体系,包括文件操作类(Read/Write/Edit等)、执行类(Bash/NotebookEdit等)、交互类(AskUserQuestion等)和信息获取类(WebFetch等)。文章揭示了Claude Code"每个工具都是一个权限边界"的核心设计理念,对比了"仅用Bash"与"权限边界设计"两种方案的优劣,特别强调了Bash工具

2025-12-02 12:09:21 1486

原创 【AI智能体】OpenManus 工具调用案例集

本文通过四个案例展示了OpenManus如何利用**工具抽象(Tool Abstraction)**机制,将底层复杂实现封装为LLM可理解的简单函数调用。案例1演示了LLM通过computer_use工具控制远程沙箱GUI,无需了解底层架构;案例2通过crawl4ai工具将网页内容智能清洗为Markdown,避免处理HTML噪音;案例3展示了多智能体协作任务分解与执行;案例4则通过python_execute工具在沙箱中安全执行非受信代码。OpenManus的设计核心是“复杂留给自己,简单留给LLM”,通过

2025-11-21 10:55:51 854

原创 【AI智能体】OpenManus项目架构分析报告

本文深入分析了OpenManus项目在AI智能体领域的三大核心设计:1)采用滑动窗口截断和动态Prompt注入的上下文管理策略,有效防止Token溢出;2)基于"共享计划"的多智能体协作机制,通过全局状态维护实现高效解耦;3)构建了包含Python执行沙箱、浏览器操作等核心工具集的MCP生态,并深度集成Daytona虚拟环境实现安全执行。该项目虽完成度有限,但其在动态上下文构建、Token效率优化及工具链抽象等方面的创新设计,为AI智能体工程师提供了有价值的参考范式。

2025-11-21 10:28:02 1006

原创 WorkTool微信消息识别与图片回调技术实现详解

本文详细介绍了WorkTool的微信消息识别与图片处理技术方案。系统采用LCS算法实现99%以上的消息识别准确率,包含消息过滤、智能存储等机制。图片处理方面实现了自动点击、保存、base64转换和网络回调的全流程自动化。技术亮点包括模块化设计、统一接口管理、完善的异常处理和详细的日志系统。该方案已在生产环境稳定运行,支持企业微信自动化、客服系统集成等多种应用场景,具有高精度识别、高效处理和企业级稳定性等特点,为微信自动化提供了可靠的技术支撑。

2025-09-14 17:30:32 1039

原创 FunASR语音识别框架流式识别模型切换

本文对比了流式与非流式语音识别模型的配置差异。非流式组合(含VAD和标点)适合离线音频转写,而流式组合(基础ASR+实时标点)专为低延迟场景设计。关键区别在于:非流式ASR集成VAD/标点模块,处理完整音频;流式标点针对中文实时优化但精度可能降低。部署时需注意流式处理需分块逻辑,且标点模型需与ASR语言匹配。离线场景推荐非流式方案,实时场景应选择流式组合。

2025-08-25 11:34:24 832

原创 FastGPT 超级全局意图识别插件:通用场景轻松识别

在构建智能对话应用时,准确识别用户意图是核心挑战。为了解决输出不可控、准确率低、响应速度慢等问题,本文介绍了一个基于FastGPT的全局意图识别插件。该插件通过简单的JSON配置,支持定义5-10种场景意图,如查酒店、问天气等,适用于多种行业。插件的核心优势在于其高度通用性、配置简便性和快速集成能力。通过预设场景意图和JavaScript代码,插件将用户意图识别转化为选择过程,用户只需回复序号即可快速判断意图。此外,插件仅需LLM输出1个Token,确保了高精准度和快速响应。本文还提供了插件的快速上手指南和

2025-05-10 13:17:23 717

原创 postgresql 重置对应表序列最大值

然后上面虽然一个表搞定了,但我想对所有表都操作一次,那么使用如下脚本,可以在navicat等工具里直接新建查询,粘贴进去执行一下就好了(实测pg17一次解决)。原因是,insert语句如果默认写了id,就不会更新序列的值,需要自己拨一下序列的值…注:这里 _id_seq 你要看是否和自己的数据库一样,一般默认都用的这个。简单来说如下命令就好了,两个your_table 换成你自己的真实表名。当使用pg库备份并恢复时,序列的值很可能不会自动更新到最大ID。

2025-03-29 17:25:35 750

原创 增加Swap文件提升ECS云主机可用内存防止OOM

在 Linux 上增加 Swap 内存可以通过以下几种方式实现,具体方法取决于你的需求(如增加 Swap 文件或扩展 Swap 分区)。表示创建 4GB 大小的 Swap 文件,你可以根据需要调整大小。保存并退出后,Swap 文件将在系统重启后自动启用。(CentOS8,增加 Swap 文件为例):该方案适用于任何情况,操作简单,无需重启。

2025-03-26 11:45:04 397

原创 从WorkTool看RPA技术演进——移动端自动化的未来趋势

西安交大提出的两阶段框架,通过视觉解析UI并生成自然语言描述,由LLM拆解任务步骤,在147个真实任务中达到人类水平完成率。:支持鸿蒙/安卓双平台,通过视觉模型+ADB实现跨APP操作(如微信自动回复+小红书评论),任务成功率比单设备方案提升40%。:多Agent协作框架,订座任务中通过“视觉感知-Agent-执行器”链路实现端到端操作,意图理解准确率91%。:港大研发的纯视觉方案,无需后台数据支持,在AndroidWorld基准测试中超越Claude 3.5。

2025-03-12 11:03:17 1438

原创 WorkTool 技术解析:企业微信自动化办公的合规实现方案

随着企业微信用户规模突破4亿(据腾讯2023年财报),其开放生态催生了自动化办公的技术需求。传统RPA(机器人流程自动化)工具在PC端已广泛应用,但移动端自动化仍面临技术合规性、系统兼容性等挑战。本文将探讨基于Android无障碍服务的自动化方案——WorkTool的技术原理与合规边界,为开发者提供实现参考。

2025-03-12 10:37:29 2343

原创 免root运行python保活守护进程supervisor

在没有root权限的情况下,仍可以安装和使用 Python 守护进程管理工具(如supervisor保活守护进程)

2025-03-06 15:52:15 1266

原创 大模型与图数据库RAG通俗流程拆解

# 模型- 向量化模型 bce-embedding-base_v1- 重排序模型 bce-reranker-base_v1- 大语言模型 Qwen/Qwen2.5-32B-Instruct- 图数据库 tugraph- 索引 faiss# 核心流程这个调用链日志展示了一个完整的问答系统处理用户输入“百草园里有什么”的过程。本项目使用和参考了开源项目[茴香豆](https://github.com/tpoisonooo/HuixiangDou2)。以下是调用链的梳理,确保不遗漏任何步骤

2025-03-03 18:48:48 969

原创 排查和解决线程池瓶颈问题案例

日志分析:通过日志分析发现线程池的瓶颈。代码审查:确认@Async注解默认使用的线程池配置。自定义线程池:通过自定义配置增加线程池的线程数,提升并发处理能力。验证效果:通过日志和性能监控验证优化效果。希望这个案例能够帮助大家在遇到类似问题时,快速定位并解决问题。如果你有类似的经验或其他优化方案,欢迎在评论区分享!

2025-02-26 22:27:14 425

原创 1Panel快速轻量应用项目启动最佳实践

在本最佳实践中,我们采用 1Panel + Docker Compose + Cursor 的技术组合来实现快速且可靠的应用部署。

2025-02-22 17:17:22 1677

原创 kvm虚拟机网络桥接和读取ip

检查虚拟机的网络接口是否正确绑定到。在主机上创建桥接网络。

2025-01-07 14:09:46 1213 1

原创 selenium浏览器下载汇总

官网:https://googlechromelabs.github.io/chrome-for-testing/下载chrome win64位:https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.85/win64/chrome-win64.zip。

2024-12-27 15:16:04 784

原创 【监控】夜莺监控系统各环节资源压力分析

夜莺监控系统由多个关键组件构成,每个环节都面临不同的资源压力。采集端 Categraf 作为轻量级 agent,内存占用仅 30-50MB,主要压力来自采集频率和指标数量。传输层 Transfer 需要处理大量并发数据,通常消耗 1-2GB 内存,关键在于数据队列处理。索引服务 Index 负责元数据管理,需要 4-8GB 内存支持索引缓存。时序数据库 TSDB 是最消耗资源的组件,通常需要 8GB 以上内存,磁盘 IO 压力很大。告警模块消耗 2-4GB 内存,主要用于规则计算。

2024-12-24 21:11:14 794

原创 Linux Docker环境中解决中文字体乱码问题完整指南

在Linux Docker环境中运行涉及中文显示的应用时(如Selenium网页截图、PDF生成等),经常会遇到中文显示为方块或乱码的问题。这是因为Linux系统默认没有安装中文字体所导致的。我们可以从Windows系统复制常用中文字体到Docker容器中来解决这个问题。

2024-12-16 17:37:05 1822

原创 chromedriver可运行的docker环境

以常见的linux x86服务器为例。

2024-12-12 21:00:21 675

原创 CentOS8或docker镜像centos8更换镜像源

因为 CentOS 8 已经结束生命周期,原来的镜像源不可用了。我们需要将镜像源改为 CentOS 8 的替代源。

2024-12-12 20:46:14 2330

原创 Linux离线安装docker(arm64架构cpu)极速版

之前写过x86版本的快速docker安装部署,现在遇到arm64等架构cpu不适用,主要是因为安装包不通用,因此有这篇文章。cpu测试可以支持鲲鹏cpu或interl arm版本离线安装docker,10分钟极速搞定!亲测适用于CentOS8 及其衍生版本。

2024-11-28 14:29:48 1330

原创 快速构建fastapi环境容器

我们经常需要启动一个简单的python网络程序,并提供api端口,下面进行一个简单的Python容器环境制作(依赖列表可按需增减)

2024-11-27 16:01:36 503

原创 dataease一键部署镜像脚本

dataease一键部署镜像脚本仅记录供学习参考,也做备份用一键部署脚本setup.sh。

2024-10-24 10:44:39 622

原创 YOLOv10模型训练深度解析:优化策略与实践心得

在计算机视觉领域,YOLO (You Only Look Once) 系列一直是目标检测的标杆。随着YOLOv10的发布,我们迎来了更强大、更灵活的检测模型。本文将深入探讨YOLOv10的训练过程,分享一些优化策略和实践心得。YOLOv10的训练是一个复杂而有趣的过程。通过精心的数据准备、超参数调优和训练策略优化,我们可以充分发挥这个强大模型的潜力。当然其也有定位,就是适合做图像物体检测任务,而对单标签图像分类任务还是使用其他模型,如efficientnet等。

2024-10-16 17:12:17 1628 1

原创 AI异常检测方案实施-基于基准块的无监督学习

上文讲到AI异常检测的几种方案规划,点击查看由于我们只有“正确答案”,因此当前最符合的做法是使用autoencoder做无监督学习。

2024-09-30 11:31:17 1201

原创 AI异常检测方案规划

后续发布实践方案,敬请关注!

2024-09-30 11:24:35 1389

原创 ollama自定义模型容器部署(cpu版)

使用GPU需要安装 NVIDIA Container Toolkit⁠: https://hub.docker.com/r/ollama/ollama。如果想使用Qwen2.5-7B模型,可以在这个模型页选择适合自己算力需求的模型下载。ollama create #从模型文件创建模型。ollama pull #从注册表中拉取模型。ollama serve #启动ollama。ollama run #运行模型。

2024-09-21 10:55:51 2043

原创 ollama+LLM llama3.1 部署教程(cpu版)

使用GPU需要安装 NVIDIA Container Toolkit⁠: https://hub.docker.com/r/ollama/ollama。有些大佬已经把几乎所有主流开源模型的gguf量化模型都整理好了,比如https://hf-mirror.com/bartowski。如果想使用Qwen2.5-7B模型,可以在这个模型页选择适合自己算力需求的模型下载。ollama create #从模型文件创建模型。ollama serve #启动ollama。

2024-09-20 10:22:21 859

原创 FunASR搭建语音识别服务和VAD检测

该服务使用阿里达摩院的模型,并支持SSL连接、2pass模式以及语音热词处理。你还需要从阿里云上下载相关的语音识别模型、VAD模型、标点符号模型等。这些模型是由达摩院发布的,具体的模型目录稍后会在启动命令中给出。这样,你的VAD模型将在600毫秒后检测到结束静音,适用于需要更快速响应的语音识别场景。的VAD参数,你可以根据具体需求定制VAD的检测灵敏度和时长。这些参数控制了VAD的静音检测、语音与噪音之间的比率等。这里需要确保你的客户端主机和端口设置正确,并且使用的是2pass模式。

2024-09-10 20:53:30 7098 3

原创 使用Python写一个适用于Dify和FastGPT的JsonPath插件

通过上述步骤,我们实现了一个简单但功能强大的 JsonPath 插件,适用于 Dify 和 FastGPT。它可以处理 JSONPath 查询、正则表达式提取以及 JavaScript 沙盒执行等任务。希望这篇文章能帮助你更好地理解如何构建类似的插件,并将其应用到你的项目中。如果你有任何问题或建议,欢迎在评论区留言讨论。

2024-08-31 09:43:39 1738

原创 在 Docker 中配置 npm 和 pnpm 使用镜像源

在 Docker 中构建前端应用时,使用 npm 或 pnpm 安装依赖是必不可少的步骤。为了解决这个问题,我们可以配置 npm 和 pnpm 使用国内的淘宝镜像源。在 Docker 中构建 Node.js 应用时,配置 npm 和 pnpm 使用国内的镜像源,可以显著提高依赖安装的速度和稳定性。通过这些配置,你将能够在网络环境受限的情况下,依然快速、高效地构建你的前端应用。如果你需要绕过网络限制,可以通过设置代理服务器的方式来强制 npm 和 pnpm 请求通过代理。,这是由于锁定文件或缓存的影响。

2024-08-30 17:26:43 6251

IconWorkshopshiyongban

ico图标制作软件。支持x windows欢迎大家前来下载。

2013-11-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除