自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

主攻大数据 人工智能 物联网 安全 低空经济等方向。mtsc 、gtest特邀分享嘉宾

著书两本《RAG系统测试与评估:从理论到实践》《精通JMeter接口测试:中高级工程师实战指南》

  • 博客(908)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于MCP与主流AI技术架构 水利 发电 公园中的应用

利用MCP+OpenCWA+AI技术架构,可以在水利、发电、公园三大领域实现统一的技术底座,通过MCP解决设备互联互通问题,通过OpenCWA解决跨系统协同问题,通过AI解决智能决策问题。这套架构已在电力智慧园区、智慧公园、小水电监管等领域得到验证。

2026-06-06 15:33:03 195

原创 编写一个MCP(Model Context Protocol)服务

编写一个MCP(Model Context Protocol)服务。MCP是Anthropic提出的开放协议,用于让AI助手能够与外部数据源和工具进行交互。下面我将创建一个实用的MCP服务示例,包含多种工具:文件操作、网络请求、天气查询等。2. 安装依赖3. TypeScript配置4. 类型定义5. 工具实现6. MCP服务主入口7. 配置和使用编译和运行在Claude Desktop中配置在Claude Desktop的配置文件中添加:

2026-06-06 15:23:45 238

原创 AI正在深刻改变项目管理的底层逻辑

AI正在深刻改变项目管理的底层逻辑——从"人控流程+工具辅助"演进为"AI智能协同+人类监督决策"。这不仅是工具的升级,更是项目经理角色的重构。

2026-06-06 15:15:34 210

原创 利用 Cesium 实现设备资产的三维模拟与可视化查看

在水利工程 AI 运行管理平台中,利用实现设备资产的三维模拟与可视化查看,是构建“数字孪生”大屏的核心环节。下面我将为你提供一套完整的实现方案,涵盖:场景初始化、设备资产(点位/3D模型)渲染、状态动态模拟(正常/告警)、以及点击交互查看详情。

2026-06-05 12:01:43 158

原创 YOLO服务搭建

的详细步骤,或者。

2026-06-05 11:51:43 217

原创 大模型项目软件测试:技术方案与实施路径

阶段测试模式核心能力传统手工用例 + 确定性断言功能点覆盖过渡AI辅助生成 + 人工审核效率提升目标Agent驱动 + 自适应演化质量边界探索大模型测试的行业分水岭已经出现——不是会不会自动化,而是会不会用AI做自动化。测试工程师的角色正从“用例编写者”向“测试场景设计师”转变,核心能力升级为:评估框架选型、自动化对抗测试设计、成本可观测体系构建。如需针对具体模型类型(如对话Agent、代码生成、RAG)的详细方案,可进一步展开说明。

2026-05-08 10:04:43 67

原创 对话Agent、代码生成、RAG 专项测试详细方案

场景自动化程度开源工具成熟度业界基准存在落地建议代码生成⭐⭐⭐⭐⭐极高(BigCode标准)直接采用RAG⭐⭐⭐⭐中高(Ragas, Azure AI)基础性、正确性需适配业务对话Agent⭐⭐⭐中(Sensei, SDialog)任务完成率需较多定制核心趋势:代码生成测试最成熟,RAG测试框架正在完善,对话Agent测试是当前研究热点。建议优先以代码生成为试点,再逐步扩展至RAG和对话Agent场景。

2026-05-08 10:02:07 175

原创 项目管理中,避免研发团队“过度预估”时间

你的动作预期效果要求所有任务拆解 ≤ 2天减少估算模糊区,自然减少缓冲用三点估算(乐观/可能/悲观)代替单点值将缓冲显性化,变隐藏为协商区分“纯技术耗时”与“日历时间”让团队不再被迫为一厢情愿的日程买单复盘偏差率并作为数据展示让高估现象无处藏身,自我纠正缩短计划周期(滚动规划)限制能做大的缓冲的空间建立“早期举手升级”机制允许保留少量缓冲而非大量最根本的一点:团队过度预估,通常是因为他们被“准时交付”的压力所绑架,而唯一的防御手段就是加时间。如果你能创造一个环境,其中。

2026-04-29 10:51:30 327

原创 项目管理的AI转型

维度结论核心理念AI项目管理的核心是让AI参与“感知-预测-执行”闭环,而非仅做信息录入选型逻辑小团队选轻量(ClickUp/飞书多维表格),大团队选重型(Jira/ONES/微软Planner)实施要点先跑通高价值场景(需求/风险),再扩用到全流程成功前提数据互通、流程标准化、明确“人机分工”一句话总结:项目经理的核心价值正从“催进度、传信息”转向“定方向、调算法、做决策”——这是AI时代项目管理的真正竞争力。

2026-04-24 16:41:39 1038

原创 AI时代产品经理的工作流重构

做这个转型并不复杂,可以从一个小项目建一个本地项目文件夹,按上文结构组织把现有会议纪要、用户反馈、数据导出丢进去用一个支持本地上下文的AI工具(Cursor、Trae等)打开它用AI完成一个功能点的PRD和原型,而非整个产品检查产出质量,反向优化你的输入(信息是否完整?指令是否清晰?一图总结全流程fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;

2026-04-24 16:36:26 907

原创 AI测试的技术范式变革

架构先行:采用Agent + MCP + Skills三层架构,而非零散接入多个Agent闭环自愈:建立“生成→执行→分析→修复”的反馈循环,无效测试可减少60%指标驱动:用例采纳率、自动修复成功率等量化指标指导优化方向人机协同:AI负责执行与生成,人类聚焦策略与治理一句话总结:测试工程师的核心能力正从“写脚本”转向“架构设计、能力拆分、指标建模、治理控制”——这才是AI时代质量保障的真正竞争力。

2026-04-03 11:25:57 84

原创 LLM 自动化测试平台 企业级架构图

我给你的,纯文字 + 结构清晰,你复制到 PPT 就能用。

2026-04-03 11:12:05 287

原创 本地部署 GraphRAG

你的需求推荐方案快速体验、技术调研方案一:微软官方 GraphRAG + OpenAI API不想花钱、喜欢图形界面方案二企业级、大规模知识库方案三建议先从方案一入手,理解 GraphRAG 的核心流程(实体提取 → 社区检测 → 全局/局部查询),再根据实际需求切换到其他方案。

2026-04-03 11:04:37 364

原创 Ragas与LangChain是目前RAG开发与评测中最主流的组合之一(带实例和指标分析)

维度说明关系定位LangChain是构建框架,Ragas是评测框架,二者互补集成方式+ LangSmith深度集成核心价值让RAG开发从“凭感觉调参”走向“指标驱动”生产就绪可集成到CI流水线,作为质量门禁# 包装LangChain模型# 传入evaluatedataset,指标评估对象所需字段核心作用生成质量检测幻觉生成质量评估切题程度检索质量衡量检索精度检索质量衡量检索覆盖率RAGAS 的评估指标将复杂的质量判断拆解为可量化、可复现的数学公式。

2026-04-03 10:59:54 164

原创 测试智能体系统技术实现方案

本方案采用构建多智能体协作系统,实现从需求解析到测试用例生成的完整自动化流程。fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;输出层智能体集群输入层自然语言需求需求解析Agent用例设计Agent代码生成Agent验证Agent测试用例文档可执行脚本创建import os# 初始化LLM(使用GPT-4或DeepSeek)

2026-04-03 10:52:29 106

原创 测试智能体(Testing Agent)为核心,融合生成式AI、多智能体协作等技术

这个电商购物车测试实例展示了测试智能体集群需求解析智能体→ 将自然语言转化为结构化测试点用例设计智能体→ 覆盖正常/边界/异常/组合场景代码生成智能体→ 自动输出可执行测试脚本验证智能体→ 执行测试、分析结果、提供评审这一范式已在多个真实系统(腾讯AI智测平台、MetaGPT RealDevWorld、微软Critique等)中得到验证,标志着软件测试正从"自动化脚本"演进为"智能体自主协作"。

2026-04-03 10:50:01 265

原创 mac 安装openclaw

三 升级完成后通过npm 安装openclaw(权限最好使用sudo 切换到超级管理员权限)二 按照openclaw官方要求node的版本不能低于22,所以需要升级node。四 然后通过openclaw onboard 对其进行初始化配置。安装完成后,即可通过本地的形式开始访问。一 检查本地node版本。

2026-03-22 10:29:51 434

原创 飞书集成openclaw

官方教程:在连接之前,我们需要在飞书侧创建一个“应用”容器来承载 AI。点击“创建应用” -> “企业自建应用”。填写基本信息:应用名称、应用描述及图标。这部分信息将直接影响你后续的使用体验,建议想个有趣的名字填写。获取核心凭证:进入应用详情页,在左侧导航栏找到“凭证与基础信息”。关键步骤: 复制并妥善保存 App ID 和 App Secret。这两个参数是 OpenClaw 握手飞书服务器的唯一凭证,切勿泄露。点击“开通权限”,根据截图指引搜索并添加必要的权限。

2026-03-19 15:37:17 1021

原创 安装Openclaw问题解决

https://clawhub.ai/ 在这个地址最好关联一下自己的github账号看到这个错误先别着急,这说明你在使用clawhub时触发了平台的频率限制。这个问题的核心是,而不是网络问题。我帮你整理了一套完整的排查和解决方案,按顺序操作,应该能很快解决。

2026-03-10 11:49:26 1014

原创 OpenClaw本地开发控制VS Code、远程控制浏览器

本地开发控制VS Code:核心是 WebSocket 直连 + 系统命令执行,适合开发场景;远程控制浏览器:通过飞书渠道订阅消息,指令透传至本地脚本,适合远程操作;脚本可直接复制运行,仅需替换 Node ID 为自定义值,批准配对即可使用。

2026-03-04 15:37:27 889

原创 windows下安装openclaw

运行代码" iwr -useb https://openclaw.ai/install.ps1 | iex" 知道安装成功。当然还可以通过openclaw相关命令对其进行模型的配置,以及相关app启动工具套件的配置,请自行查阅相关资料。使用 openclaw gateway install 打开浏览器访问模式。如果有这两张图中的情形,openclaw算是安装成功了。1.打开powershell (使用管理员打开)使用 openclaw -v检查是否安装成功。

2026-03-04 14:22:27 2455

原创 DeepEval、RAGAS 和 Grafana 组合起来实践

维度DeepEval贡献RAGAS贡献Grafana贡献可解释性提供评分理由和调试日志可视化展示专业性提供RAG专用指标可观测性集成Confident AI平台实时监控和告警成本控制追踪token消耗成本趋势分析用户反馈满意度监控。

2026-02-28 11:09:30 618

原创 结合RAGChecker和RAGAS进行RAG系统评估

分层评估策略日常监控:使用RAGAS + LangSmith(采样5-10%)版本迭代:全量RAGAS评估 + 问题样本RAGChecker诊断深度优化:对发现的问题模块使用RAGChecker专项分析成本控制RAGChecker使用更强大的模型(GPT-4),成本较高,建议只对问题样本使用RAGAS可以使用GPT-3.5-Turbo进行日常评估指标解读重点RAGAS:快速发现问题(忠实度低?召回率低?RAGChecker:深入诊断原因(幻觉率高?噪声敏感?

2026-02-28 11:06:18 625

原创 RAGAS + LangSmith 的组合是目前评估 RAG 系统的主流实践方案

构建你的 RAG 系统# 假设你已经有了向量库llm=llm,return_source_documents=True # 重要:返回检索到的文档# 定义预测函数(LangSmith 会调用这个函数)return {配置 LangSmith 环境变量用 3-5 个核心指标开始(faithfulness, answer_relevancy, context_recall)在测试集上手动运行评估,确认指标合理性。

2026-02-28 11:03:31 946

原创 大模型在物联网中的应用

大模型让物联网从“连接万物”走向“理解万物、对话万物”。以前是你告诉设备做什么,现在是设备懂你想要什么。IoT是数字世界的“五官”,大模型是“大脑”。

2026-02-26 11:57:34 368

原创 xmind用例通过excel整理方式(注意!!不是通过python解析ximind文件转化成用例)

查看空格数量,如果是4个空格,直接用上面的公式即可。如果您的步骤是用多个空格分隔的,这个最简单!这样既保留了换行效果,又去除了公式依赖。(需要Excel 365/2021),B列显示处理结果(带换行)(部分Excel版本支持)

2026-01-16 15:42:34 416

原创 企业级大模型测试的可落地、分阶段流程

企业大模型测试需遵循「准备→功能→非功能→验收」的全流程,核心是量化指标+场景化验证+生产级保障;功能测试聚焦「业务准确性」,非功能测试聚焦「安全/性能/成本」,两者缺一不可;测试不是一次性工作,需在灰度上线后持续监控、迭代优化,确保模型符合企业生产要求。

2026-01-06 16:15:42 135

原创 Python+requests实现的接口自动化中引入AI

你希望在Python+requests实现的接口自动化中引入AI,核心是让AI完成「测试用例生成、请求参数智能校验、响应结果自动断言、缺陷智能分析」等工作,替代人工编写固定脚本的重复劳动。以下是完整的代码级实现方案,以电商订单接口为例,从0到1落地AI驱动的接口自动化。新建文件,配置OpenAI API密钥:

2026-01-06 16:11:25 141

原创 软件自动化测试引入AI的实战案例

某电商APP每周迭代1次,核心功能包括。

2026-01-06 16:08:23 1083

原创 软件测试中引入人工智能(AI)

在软件测试中引入,能够解决传统测试的痛点(如重复劳动多、回归测试成本高、难以覆盖复杂场景、缺陷定位慢等),实现测试的。以下是AI在软件测试中的核心应用场景、技术方案、工具及实施步骤,兼顾理论与实操。

2026-01-06 16:06:39 2003

原创 GraphRAG与其他应用集成教程

GraphRAG集成的核心是封装为标准化API,对接任意应用(Web、本地LLM、数据库);基础场景用「FastAPI+NetworkX+OpenAI」快速跑通,生产环境替换为「Neo4j+本地LLM」;非开发人员可通过Streamlit快速搭建可视化界面,降低使用门槛。

2026-01-06 16:04:40 926

原创 GraphRAG的使用教程

GraphRAG核心流程是「文本拆分→实体/关系提取→图构建→图检索→LLM生成」,新手可先从NetworkX+OpenAI入手,快速跑通流程;实体/关系提取是关键,新手用手动规则+LLM结合,进阶可训练专用提取模型;小规模数据用NetworkX(轻量),大规模/生产环境用Neo4j(高性能)。

2026-01-06 16:02:00 499

原创 高级研发计划表字段设计(专业版)

一份高级研发计划表不仅是任务清单,更是。

2025-12-18 17:44:38 751

原创 预防研发任务无限延期的系统性策略

任务无限延期的根本原因往往是。

2025-12-18 17:29:24 518

原创 需求变更时的研发任务时间调整策略

当新任务插入时,合理调整研发时间安排是确保项目平稳推进的关键。

2025-12-18 17:22:57 1164

原创 需求拆解的最佳颗粒度:让研发高效评估的黄金标准

拆解不是一次性的活动,而是。

2025-12-18 17:19:09 794

原创 PRD拆解后研发工时评估的最佳实践

准确的估算不是一次性的活动,而是需要。

2025-12-18 17:15:10 1035

原创 前后端分离项目协同开发管理方案

作为管理前后端分离项目的项目经理,你需要建立。

2025-12-18 17:11:42 970

原创 大模型领域中模型压缩与高效推理的核心技术之一:量化技术

它通过在精度和效率之间寻找最佳平衡点,使得庞大的模型能够运行在资源受限的设备上,并实现实时或准实时的推理。对称量化更简单,计算开销更小,但如果原始张量分布不对称,会浪费一部分整数表示范围。在深入了解量化之前,首先要明白其驱动力。这样,整个计算的核心部分就从FP32计算转移到了高效的INT8计算上。给定一个浮点数张量 ( F ),我们将其量化为整数张量 ( Q )。将整数张量 ( Q ) 转换回近似的浮点数张量 ( F’ )。这是量化技术的核心分类,理解它们至关重要。量化的精细程度不同,对精度的影响也不同。

2025-10-08 14:43:32 909

原创 PyTorch 的 Autograd 系统进行一次全面且深入的详解

叶子张量:用户直接创建的张量,不是通过操作产生的非叶子张量:通过对叶子张量进行操作得到的张量x = torch.tensor(2.0, requires_grad=True) # 叶子张量y = x ** 2 # 非叶子张量z = y + 1 # 非叶子张量ctx.save_for_backward(input) # 保存输入供反向传播使用grad_input[input < 0] = 0 # ReLU的导数# 使用自定义函数。

2025-10-08 12:06:37 863

Django 中集成 Apache Kafka 可以实现异步消息处理、数据流式传输

Django 中集成 Apache Kafka 可以实现异步消息处理、数据流式传输

2025-04-17

Django 实现物联网管理系统的详细方案

Django 实现物联网管理系统的详细方案

2025-04-17

Django 结合 Vue 实现简单管理系统的详解

Django 结合 Vue 实现简单管理系统的详解

2025-04-17

Django 结合 Celery 实现异步任务处理和定时任务

Django 结合 Celery 实现异步任务处理和定时任务

2025-04-17

Django REST framework 并结合 mixin 的示例

Django REST framework 并结合 mixin 的示例

2025-04-17

geoserver 源码 1.npm install

geoserver 源码 1.npm install

2024-12-03

可用指标 提供以下与 Tomcat 相关的指标: 线程池指标 会话指标 请求处理器指标 数据库连接池指标 Tomcat 版本信

可用指标 提供以下与 Tomcat 相关的指标: 线程池指标 会话指标 请求处理器指标 数据库连接池指标 Tomcat 版本信息 Servlet 响应时间指标 数据库响应时间指标 使用此库 如果你以常规非嵌入式方式运行 Tomcat,我们推荐将以下 JAR 文件(请参阅 pom.xml 获取正确版本)添加到 $CATALINA_BASE/lib 目录,或者添加到 Tomcat 的 common.loader 路径下的任意目录。 使用 common.loader 很重要,因为我们需要确保所有指标都使用相同的类加载器注册。 simpleclient simpleclient_common simpleclient_servlet simpleclient_servlet_common simpleclient_hotspot tomcat_exporter_client 接下来,将tomcat_exporter_servlet的 WAR 文件重命名为 metrics.war,并将其添加到 Tomcat 的 webapps 目录中。重启 Tomcat 后,你应该可以通过 /metrics

2024-11-18

Prometheus 监控tomcat的运行情况

1.可以利用Prometheus监控tomcat的运行情况 2.主要监控tomacat的 ### Available metrics The following Tomcat related metrics are provided: * Thread pool metrics * Session metrics * Request processor metrics * Database connection pool metrics * Tomcat version info * Servlet response time metrics * Database response time metrics

2024-11-18

格式化输出双String类类型的json格式字符串

1.api测试需要格式化输出json格式且json格式中具有时间戳需要被参数化 2."{\n" + " \"appId\":\"cdbflc_access_token\",\n" + " \"timestamp\":\"%s\",\n" + " \"frameNo\": \"UCCS1702494201659\",\n" + " \"pageNum\": \"1\",\n" + " \"pageSize\": \"10\"\n" + " }"; public static String format(String jsonCode, String timeCode)

2023-12-20

mysql安装配置附带了window和Linux安装

mysql安装配置教程

2023-09-18

描述BUG规范探究设计方案实现

BUG描述设计和方案实现探究,描述一个可读性的bug字段

2023-09-08

海康威视的视频摄像头实现配置和册数方案设计网络铺设逻辑

海康威视的视频摄像头,近距离实现对物体拍摄,并通过算法实现对显示屏上的数据进行识别。

2023-09-07

locust-exporter

Python集成locust做单接口测试,收集单接口的性能表现,并与grafan和普罗米修斯集成,使之呈现可视化,让数据得以保存并做好性能调优

2023-09-07

tbox测试方案设计实现短信指令下发并收集数据

tbox测试方案设计,通过短信指令下发将车载终端的数据收集并返回给集成商,使之对车辆的远程控制和定位设计

2023-09-07

一键分析monkey日志

一键分析monkey日志 有利于测试对移动开发 进行 友好定位 提高开发效率

2018-06-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除