- 博客(908)
- 资源 (1)
- 收藏
- 关注
原创 基于MCP与主流AI技术架构 水利 发电 公园中的应用
利用MCP+OpenCWA+AI技术架构,可以在水利、发电、公园三大领域实现统一的技术底座,通过MCP解决设备互联互通问题,通过OpenCWA解决跨系统协同问题,通过AI解决智能决策问题。这套架构已在电力智慧园区、智慧公园、小水电监管等领域得到验证。
2026-06-06 15:33:03
195
原创 编写一个MCP(Model Context Protocol)服务
编写一个MCP(Model Context Protocol)服务。MCP是Anthropic提出的开放协议,用于让AI助手能够与外部数据源和工具进行交互。下面我将创建一个实用的MCP服务示例,包含多种工具:文件操作、网络请求、天气查询等。2. 安装依赖3. TypeScript配置4. 类型定义5. 工具实现6. MCP服务主入口7. 配置和使用编译和运行在Claude Desktop中配置在Claude Desktop的配置文件中添加:
2026-06-06 15:23:45
238
原创 AI正在深刻改变项目管理的底层逻辑
AI正在深刻改变项目管理的底层逻辑——从"人控流程+工具辅助"演进为"AI智能协同+人类监督决策"。这不仅是工具的升级,更是项目经理角色的重构。
2026-06-06 15:15:34
210
原创 利用 Cesium 实现设备资产的三维模拟与可视化查看
在水利工程 AI 运行管理平台中,利用实现设备资产的三维模拟与可视化查看,是构建“数字孪生”大屏的核心环节。下面我将为你提供一套完整的实现方案,涵盖:场景初始化、设备资产(点位/3D模型)渲染、状态动态模拟(正常/告警)、以及点击交互查看详情。
2026-06-05 12:01:43
158
原创 大模型项目软件测试:技术方案与实施路径
阶段测试模式核心能力传统手工用例 + 确定性断言功能点覆盖过渡AI辅助生成 + 人工审核效率提升目标Agent驱动 + 自适应演化质量边界探索大模型测试的行业分水岭已经出现——不是会不会自动化,而是会不会用AI做自动化。测试工程师的角色正从“用例编写者”向“测试场景设计师”转变,核心能力升级为:评估框架选型、自动化对抗测试设计、成本可观测体系构建。如需针对具体模型类型(如对话Agent、代码生成、RAG)的详细方案,可进一步展开说明。
2026-05-08 10:04:43
67
原创 对话Agent、代码生成、RAG 专项测试详细方案
场景自动化程度开源工具成熟度业界基准存在落地建议代码生成⭐⭐⭐⭐⭐极高(BigCode标准)直接采用RAG⭐⭐⭐⭐中高(Ragas, Azure AI)基础性、正确性需适配业务对话Agent⭐⭐⭐中(Sensei, SDialog)任务完成率需较多定制核心趋势:代码生成测试最成熟,RAG测试框架正在完善,对话Agent测试是当前研究热点。建议优先以代码生成为试点,再逐步扩展至RAG和对话Agent场景。
2026-05-08 10:02:07
175
原创 项目管理中,避免研发团队“过度预估”时间
你的动作预期效果要求所有任务拆解 ≤ 2天减少估算模糊区,自然减少缓冲用三点估算(乐观/可能/悲观)代替单点值将缓冲显性化,变隐藏为协商区分“纯技术耗时”与“日历时间”让团队不再被迫为一厢情愿的日程买单复盘偏差率并作为数据展示让高估现象无处藏身,自我纠正缩短计划周期(滚动规划)限制能做大的缓冲的空间建立“早期举手升级”机制允许保留少量缓冲而非大量最根本的一点:团队过度预估,通常是因为他们被“准时交付”的压力所绑架,而唯一的防御手段就是加时间。如果你能创造一个环境,其中。
2026-04-29 10:51:30
327
原创 项目管理的AI转型
维度结论核心理念AI项目管理的核心是让AI参与“感知-预测-执行”闭环,而非仅做信息录入选型逻辑小团队选轻量(ClickUp/飞书多维表格),大团队选重型(Jira/ONES/微软Planner)实施要点先跑通高价值场景(需求/风险),再扩用到全流程成功前提数据互通、流程标准化、明确“人机分工”一句话总结:项目经理的核心价值正从“催进度、传信息”转向“定方向、调算法、做决策”——这是AI时代项目管理的真正竞争力。
2026-04-24 16:41:39
1038
原创 AI时代产品经理的工作流重构
做这个转型并不复杂,可以从一个小项目建一个本地项目文件夹,按上文结构组织把现有会议纪要、用户反馈、数据导出丢进去用一个支持本地上下文的AI工具(Cursor、Trae等)打开它用AI完成一个功能点的PRD和原型,而非整个产品检查产出质量,反向优化你的输入(信息是否完整?指令是否清晰?一图总结全流程fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;
2026-04-24 16:36:26
907
原创 AI测试的技术范式变革
架构先行:采用Agent + MCP + Skills三层架构,而非零散接入多个Agent闭环自愈:建立“生成→执行→分析→修复”的反馈循环,无效测试可减少60%指标驱动:用例采纳率、自动修复成功率等量化指标指导优化方向人机协同:AI负责执行与生成,人类聚焦策略与治理一句话总结:测试工程师的核心能力正从“写脚本”转向“架构设计、能力拆分、指标建模、治理控制”——这才是AI时代质量保障的真正竞争力。
2026-04-03 11:25:57
84
原创 本地部署 GraphRAG
你的需求推荐方案快速体验、技术调研方案一:微软官方 GraphRAG + OpenAI API不想花钱、喜欢图形界面方案二企业级、大规模知识库方案三建议先从方案一入手,理解 GraphRAG 的核心流程(实体提取 → 社区检测 → 全局/局部查询),再根据实际需求切换到其他方案。
2026-04-03 11:04:37
364
原创 Ragas与LangChain是目前RAG开发与评测中最主流的组合之一(带实例和指标分析)
维度说明关系定位LangChain是构建框架,Ragas是评测框架,二者互补集成方式+ LangSmith深度集成核心价值让RAG开发从“凭感觉调参”走向“指标驱动”生产就绪可集成到CI流水线,作为质量门禁# 包装LangChain模型# 传入evaluatedataset,指标评估对象所需字段核心作用生成质量检测幻觉生成质量评估切题程度检索质量衡量检索精度检索质量衡量检索覆盖率RAGAS 的评估指标将复杂的质量判断拆解为可量化、可复现的数学公式。
2026-04-03 10:59:54
164
原创 测试智能体系统技术实现方案
本方案采用构建多智能体协作系统,实现从需求解析到测试用例生成的完整自动化流程。fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;输出层智能体集群输入层自然语言需求需求解析Agent用例设计Agent代码生成Agent验证Agent测试用例文档可执行脚本创建import os# 初始化LLM(使用GPT-4或DeepSeek)
2026-04-03 10:52:29
106
原创 测试智能体(Testing Agent)为核心,融合生成式AI、多智能体协作等技术
这个电商购物车测试实例展示了测试智能体集群需求解析智能体→ 将自然语言转化为结构化测试点用例设计智能体→ 覆盖正常/边界/异常/组合场景代码生成智能体→ 自动输出可执行测试脚本验证智能体→ 执行测试、分析结果、提供评审这一范式已在多个真实系统(腾讯AI智测平台、MetaGPT RealDevWorld、微软Critique等)中得到验证,标志着软件测试正从"自动化脚本"演进为"智能体自主协作"。
2026-04-03 10:50:01
265
原创 mac 安装openclaw
三 升级完成后通过npm 安装openclaw(权限最好使用sudo 切换到超级管理员权限)二 按照openclaw官方要求node的版本不能低于22,所以需要升级node。四 然后通过openclaw onboard 对其进行初始化配置。安装完成后,即可通过本地的形式开始访问。一 检查本地node版本。
2026-03-22 10:29:51
434
原创 飞书集成openclaw
官方教程:在连接之前,我们需要在飞书侧创建一个“应用”容器来承载 AI。点击“创建应用” -> “企业自建应用”。填写基本信息:应用名称、应用描述及图标。这部分信息将直接影响你后续的使用体验,建议想个有趣的名字填写。获取核心凭证:进入应用详情页,在左侧导航栏找到“凭证与基础信息”。关键步骤: 复制并妥善保存 App ID 和 App Secret。这两个参数是 OpenClaw 握手飞书服务器的唯一凭证,切勿泄露。点击“开通权限”,根据截图指引搜索并添加必要的权限。
2026-03-19 15:37:17
1021
原创 安装Openclaw问题解决
https://clawhub.ai/ 在这个地址最好关联一下自己的github账号看到这个错误先别着急,这说明你在使用clawhub时触发了平台的频率限制。这个问题的核心是,而不是网络问题。我帮你整理了一套完整的排查和解决方案,按顺序操作,应该能很快解决。
2026-03-10 11:49:26
1014
原创 OpenClaw本地开发控制VS Code、远程控制浏览器
本地开发控制VS Code:核心是 WebSocket 直连 + 系统命令执行,适合开发场景;远程控制浏览器:通过飞书渠道订阅消息,指令透传至本地脚本,适合远程操作;脚本可直接复制运行,仅需替换 Node ID 为自定义值,批准配对即可使用。
2026-03-04 15:37:27
889
原创 windows下安装openclaw
运行代码" iwr -useb https://openclaw.ai/install.ps1 | iex" 知道安装成功。当然还可以通过openclaw相关命令对其进行模型的配置,以及相关app启动工具套件的配置,请自行查阅相关资料。使用 openclaw gateway install 打开浏览器访问模式。如果有这两张图中的情形,openclaw算是安装成功了。1.打开powershell (使用管理员打开)使用 openclaw -v检查是否安装成功。
2026-03-04 14:22:27
2455
原创 DeepEval、RAGAS 和 Grafana 组合起来实践
维度DeepEval贡献RAGAS贡献Grafana贡献可解释性提供评分理由和调试日志可视化展示专业性提供RAG专用指标可观测性集成Confident AI平台实时监控和告警成本控制追踪token消耗成本趋势分析用户反馈满意度监控。
2026-02-28 11:09:30
618
原创 结合RAGChecker和RAGAS进行RAG系统评估
分层评估策略日常监控:使用RAGAS + LangSmith(采样5-10%)版本迭代:全量RAGAS评估 + 问题样本RAGChecker诊断深度优化:对发现的问题模块使用RAGChecker专项分析成本控制RAGChecker使用更强大的模型(GPT-4),成本较高,建议只对问题样本使用RAGAS可以使用GPT-3.5-Turbo进行日常评估指标解读重点RAGAS:快速发现问题(忠实度低?召回率低?RAGChecker:深入诊断原因(幻觉率高?噪声敏感?
2026-02-28 11:06:18
625
原创 RAGAS + LangSmith 的组合是目前评估 RAG 系统的主流实践方案
构建你的 RAG 系统# 假设你已经有了向量库llm=llm,return_source_documents=True # 重要:返回检索到的文档# 定义预测函数(LangSmith 会调用这个函数)return {配置 LangSmith 环境变量用 3-5 个核心指标开始(faithfulness, answer_relevancy, context_recall)在测试集上手动运行评估,确认指标合理性。
2026-02-28 11:03:31
946
原创 大模型在物联网中的应用
大模型让物联网从“连接万物”走向“理解万物、对话万物”。以前是你告诉设备做什么,现在是设备懂你想要什么。IoT是数字世界的“五官”,大模型是“大脑”。
2026-02-26 11:57:34
368
原创 xmind用例通过excel整理方式(注意!!不是通过python解析ximind文件转化成用例)
查看空格数量,如果是4个空格,直接用上面的公式即可。如果您的步骤是用多个空格分隔的,这个最简单!这样既保留了换行效果,又去除了公式依赖。(需要Excel 365/2021),B列显示处理结果(带换行)(部分Excel版本支持)
2026-01-16 15:42:34
416
原创 企业级大模型测试的可落地、分阶段流程
企业大模型测试需遵循「准备→功能→非功能→验收」的全流程,核心是量化指标+场景化验证+生产级保障;功能测试聚焦「业务准确性」,非功能测试聚焦「安全/性能/成本」,两者缺一不可;测试不是一次性工作,需在灰度上线后持续监控、迭代优化,确保模型符合企业生产要求。
2026-01-06 16:15:42
135
原创 Python+requests实现的接口自动化中引入AI
你希望在Python+requests实现的接口自动化中引入AI,核心是让AI完成「测试用例生成、请求参数智能校验、响应结果自动断言、缺陷智能分析」等工作,替代人工编写固定脚本的重复劳动。以下是完整的代码级实现方案,以电商订单接口为例,从0到1落地AI驱动的接口自动化。新建文件,配置OpenAI API密钥:
2026-01-06 16:11:25
141
原创 软件测试中引入人工智能(AI)
在软件测试中引入,能够解决传统测试的痛点(如重复劳动多、回归测试成本高、难以覆盖复杂场景、缺陷定位慢等),实现测试的。以下是AI在软件测试中的核心应用场景、技术方案、工具及实施步骤,兼顾理论与实操。
2026-01-06 16:06:39
2003
原创 GraphRAG与其他应用集成教程
GraphRAG集成的核心是封装为标准化API,对接任意应用(Web、本地LLM、数据库);基础场景用「FastAPI+NetworkX+OpenAI」快速跑通,生产环境替换为「Neo4j+本地LLM」;非开发人员可通过Streamlit快速搭建可视化界面,降低使用门槛。
2026-01-06 16:04:40
926
原创 GraphRAG的使用教程
GraphRAG核心流程是「文本拆分→实体/关系提取→图构建→图检索→LLM生成」,新手可先从NetworkX+OpenAI入手,快速跑通流程;实体/关系提取是关键,新手用手动规则+LLM结合,进阶可训练专用提取模型;小规模数据用NetworkX(轻量),大规模/生产环境用Neo4j(高性能)。
2026-01-06 16:02:00
499
原创 大模型领域中模型压缩与高效推理的核心技术之一:量化技术
它通过在精度和效率之间寻找最佳平衡点,使得庞大的模型能够运行在资源受限的设备上,并实现实时或准实时的推理。对称量化更简单,计算开销更小,但如果原始张量分布不对称,会浪费一部分整数表示范围。在深入了解量化之前,首先要明白其驱动力。这样,整个计算的核心部分就从FP32计算转移到了高效的INT8计算上。给定一个浮点数张量 ( F ),我们将其量化为整数张量 ( Q )。将整数张量 ( Q ) 转换回近似的浮点数张量 ( F’ )。这是量化技术的核心分类,理解它们至关重要。量化的精细程度不同,对精度的影响也不同。
2025-10-08 14:43:32
909
原创 PyTorch 的 Autograd 系统进行一次全面且深入的详解
叶子张量:用户直接创建的张量,不是通过操作产生的非叶子张量:通过对叶子张量进行操作得到的张量x = torch.tensor(2.0, requires_grad=True) # 叶子张量y = x ** 2 # 非叶子张量z = y + 1 # 非叶子张量ctx.save_for_backward(input) # 保存输入供反向传播使用grad_input[input < 0] = 0 # ReLU的导数# 使用自定义函数。
2025-10-08 12:06:37
863
可用指标 提供以下与 Tomcat 相关的指标: 线程池指标 会话指标 请求处理器指标 数据库连接池指标 Tomcat 版本信
2024-11-18
Prometheus 监控tomcat的运行情况
2024-11-18
格式化输出双String类类型的json格式字符串
2023-12-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅