自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(114)
  • 收藏
  • 关注

原创 MetaGPT Actions 模块内容整理

本文整理 https://github.com/FoundationAgents/MetaGPT/tree/main/metagpt/actions 目录下的模块内容。

2025-06-12 18:46:46 140

原创 MetaGPT 整体架构

所有插件需实现IPlugindescription: str = "自定义插件示例"# 插件核心逻辑pass# 资源清理pass功能:网页浏览与内容提取使用场景:获取实时信息、文档检索核心方法。

2025-06-12 18:29:52 272

原创 AI智能体入门 3)工具使用设计模式

工具之所以重要,是因为它们让 AI 代理具备更广泛的能力。相比仅能执行有限操作的代理,通过添加工具,代理可以执行更多种类的任务。本章将介绍“工具使用设计模式”,描述 AI 代理如何通过使用特定工具实现其目标。在本课中,我们将探讨以下问题:完成本课后,你将能够:“工具使用设计模式”聚焦于赋予大型语言模型(LLM)与外部工具交互的能力,以达成特定目标。工具是代理可执行的代码,可以是一段简单的函数,如计算器,也可以是调用第三方服务的 API,例如股票查询或天气预报。在 AI 代理的上下文中,工具是响应模型生成的

2025-06-09 08:58:00 811

原创 AI智能体入门 2)探索 AI 智能体框架

个性化推荐:AI 能分析用户行为与偏好,提供个性化的推荐、内容和体验。✅ 示例:Netflix 使用 AI 根据观影记录推荐电影和剧集,从而提升用户参与度和满意度。自动化与效率提升:AI 可自动执行重复性任务,简化工作流程,提升运营效率。✅ 示例:客户服务应用使用 AI 聊天机器人处理常见问题,降低响应时间,让人工客服专注于复杂事务。增强用户体验:通过语音识别、自然语言处理和预测文本输入等智能功能,优化整体用户体验。

2025-06-05 14:19:33 944

原创 AI智能体入门 1)AI智能体简介与应用场景介绍

什么是AI智能体?它有哪些不同类型?哪些使用场景最适合应用AI智能体?它们能带来哪些帮助?设计智能体解决方案的基本构件有哪些?AI智能体是一种系统,它通过为大型语言模型(LLMs)提供工具和知识访问权限,从而扩展其能力,使其能够执行动作。系统(System)理解智能体时,我们应将其视为一个由多个组件组成的系统,而非单一模块。环境(Environment):AI智能体所运行的定义空间。例如,如果我们有一个旅行预订智能体,其环境可能就是一个旅行预订系统,智能体通过它来完成任务。

2025-06-05 13:56:31 451

原创 AI编程之Cursor 3)高级功能与生产力提升

如果您对默认快捷键不满意,或者希望为某个常用操作设置专属快捷键,Cursor通常允许您自定义。通常在“设置”(Preferences)中找到“键盘快捷方式”(Keyboard Shortcuts)选项。您可以在这里搜索特定的命令,然后为其分配新的快捷键。

2025-06-02 15:10:23 435

原创 AI编程之Cursor 2)深入理解与高效利用AI功能

提示词是您与AI沟通的“语言”。通过自定义提示词,您可以更精确地引导AI的行为和输出格式。系统提示词(System Prompt):这是您为AI设定的全局指令或角色,它会影响AI在所有交互中的行为。“你是一名经验丰富的Python开发者,请始终提供符合PEP 8规范的代码。用户提示词(User Prompt):这是您在每次交互中直接输入给AI的指令或问题。结合系统提示词,在用户提示词中进一步细化您的需求。例如,在系统提示词设定为Python开发者后,您可以在用户提示词中直接说“编写一个文件读取函数”。

2025-06-02 15:08:45 913

原创 AI编程之Cursor 1)Cursor初体验与基础操作

在深入使用之前,我们先来明确一下Cursor到底是什么,以及它为何与众不同。

2025-06-02 15:02:36 1204

翻译 先进人工智能将如何影响中国经济前景

我们的研究人员最初预测,中国将获得与其他先进新兴市场经济体类似的AI红利,这意味着到2030年,人工智能的采用率仅为10%至20%,并在2030年代中后期达到顶峰。高盛研究部门目前预计,生成式人工智能将在2026年开始提升中国的潜在经济增长,到2030年将对中国GDP带来0.2至0.3个百分点的提振,高于此前预计的0.1个百分点。这一数字明显低于对美国15%提升的预期。尽管中国的人工智能采用速度可能快于预期,高盛的经济学家认为,这种影响可能更偏向“前期释放”,总体效果可能略低于此前的预测。

2025-05-06 18:52:32 32

翻译 生成式 AI 的重启:将潜力转化为价值的再布线之路

作者:Eric Lamarre, Alex Singla, Alexander Sukharevsky, Rodney Zemmel原文地址:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/a-generative-ai-reset-rewiring-to-turn-potential-into-value-in-2024#/是时候对生成式 AI(gen AI)进行一次重启了。

2025-05-05 19:41:43 42

原创 Prompt实战之构建语义搜索引擎 6)问答系统构建与响应生成(QA Chain)

你可以自定义提示模板来引导回答风格、输出格式等。

2025-04-30 18:43:26 1372

原创 Prompt实战之构建语义搜索引擎 5)构建向量数据库与检索器

Retriever是向量数据库的封装,LangChain 使用它来做“语义搜索”。

2025-04-30 18:41:42 973

原创 Prompt实战之构建语义搜索引擎 4)向量化与 Embedding

嵌入是将自然语言表示为稠密向量(如 1536 维浮点数向量)的过程,使得相似含义的句子具有相近的向量表示。例如,“今天天气真好”和“The weather is great today.” 会被编码为接近的向量。这样可以通过“计算向量距离”来判断语义相似度。📌 向量化让机器能够“理解”文本之间的语义关系。

2025-04-30 18:40:35 541

原创 Prompt实战之构建语义搜索引擎 3)文本切分(Text Splitting)

可以继承自定义规则,例如按段落或特定格式(如 Markdown)分段。

2025-04-30 18:39:44 723

原创 Prompt实战之构建语义搜索引擎 2)文档与加载器(Document & Loader)

在构建语义搜索系统的第一步,我们需要将原始文档导入程序中进行处理。LangChain 提供了丰富的**文档加载器(Loaders)**来从各种数据源中读取文本内容。本章将聚焦如何使用 LangChain 加载本地 PDF 文件,并将其转化为后续可处理的文档格式。如果你加载的是扫描版 PDF 或图片 PDF,请使用 OCR 加载器(如。加载 PDF 文件,它是 LangChain 提供的社区加载器之一。后续所有处理(如文本切分、嵌入生成)都会基于。)或 PDF-OCR 工具(如。LangChain 中的。

2025-04-30 18:38:40 726

原创 Prompt实战之构建语义搜索引擎 1)介绍

语义搜索(Semantic Search)正逐渐成为现代信息检索系统的核心能力,尤其在结合大语言模型(LLM)的应用中扮演着至关重要的角色。本教程将通过构建一个基于 LangChain 的语义搜索引擎,带你逐步掌握实现检索增强生成(Retrieval-Augmented Generation, RAG)系统的关键技能。LangChain是一个专为构建大语言模型应用设计的框架。文档加载与预处理;文本分块;向量化与存储;数据检索;与语言模型的无缝集成。

2025-04-30 18:38:03 1011

原创 工业/服务机器人与具身智能的前景分析

具身智能(Embodied Intelligence)强调智能体通过与物理环境的实时交互来学习和决策,是机器人技术的重要发展方向。在工业机器人和服务机器人领域,具身智能的应用前景差异显著,但均具有颠覆性潜力。具身智能正推动机器人从“自动化工具”向“自主智能体”进化,其应用前景取决于技术、成本与伦理的协同突破。

2025-04-28 20:48:12 607

原创 服务机器人供应链分析

服务机器人的供应链可分为。

2025-04-28 20:46:06 741

原创 大语言模型(LLM)行业的波特五力分析

大语言模型(Large Language Models, LLMs)是当前人工智能领域的核心赛道,其行业竞争格局受技术、资本、政策和生态多重因素影响。:⭐️⭐️⭐️(替代威胁存在,但LLM的泛化能力仍具优势):⭐️⭐️(新进入者威胁较低,但巨头跨界竞争需警惕):⭐️⭐️⭐️⭐️(竞争激烈,但市场远未饱和):⭐️⭐️⭐️⭐️⭐️(供应商议价能力极强):⭐️⭐️⭐️(购买者议价能力中等)

2025-04-28 20:40:40 817

原创 # Prompt实战之多文档总结 4)Refine 策略打造高精度总结 ##

在一些场景中,我们需要尽可能详细、准确医疗记录总结法律文档整合科研资料梳理这时候,仅仅 Map-Reduce 可能不够细致。Refine 策略。Refine 策略通过初步总结➔逐步增量完善的方式,逐步构建出高质量总结。先用第一份文档生成一个初步总结;后续每一份文档,读取之前已有总结,并结合新文档内容,逐步改进总结;最终形成一个包含全部信息的完善总结。▶️提示Refine 策略是迭代式的,适合高要求总结,但耗时略长。

2025-04-26 18:50:34 620

原创 Prompt实战之多文档总结 3)Map-Reduce 策略高效总结大规模文档

当文档数量变多、单份内容变长时,Stuff 策略就会遇到上下文超长、成本飙升等问题。这一章我们将学习Map-Reduce 策略,一种经典的分步总结法,专门应对大规模、多内容场景。Map-Reduce 策略Map 阶段:每份文档单独总结出一个“小总结”;Reduce 阶段:将所有小总结再次整合、归纳为最终总结。这种方法灵感来自分布式计算中的 MapReduce 思想,可以有效降低单次调用的上下文量,提高扩展性。

2025-04-26 18:49:33 743

原创 Prompt实战之多文档总结 2)Stuff 策略总结多文档

在本章中,我们将实践Stuff 策略。这是最简单的一种多文档总结方法:直接将所有文档堆叠(stuff)在一起,统一发送给 LLM,请求生成总结。虽然简单,但 Stuff 策略在小规模、多数文档内容较短的场景中,依然非常有效。Stuff(堆叠)策略将所有需要处理的文档一次性拼接成一条超大文本;作为一个整体传递给 LLM;由 LLM 直接输出总结内容。

2025-04-26 18:48:40 904

原创 Prompt实战之多文档总结 1)总览

在当今信息爆炸的时代,如何高效地从大量文档(如 PDF、Notion 页面、客户提问等)中提取关键信息成为一项核心挑战。大型语言模型(LLMs)以其卓越的文本理解与综合能力,为这一任务提供了强大的支持。在检索增强生成(Retrieval-Augmented Generation, 简称 RAG)体系中,文档总结不仅可以压缩大量检索到的资料,还能为 LLM 提供更简洁、精准的上下文,从而提升回答质量和效率。本书将带领你通过实际操作,掌握如何使用 LLM 来高效地总结多份文档内容。

2025-04-26 18:47:56 776

原创 Prompt实战之SQL问答系统4) 项目扩展方向

📌 可通过多智能体结构,设置一个“审批 Agent”作为代理人,判断是否交由人工。支持同时访问多个数据库,甚至是非结构化数据(如 CSV、Excel、API)。引入上下文保持机制,支持“连续追问”和“上下文相关的问题”。将智能体行为与用户权限绑定,仅允许查询自身可访问的数据。构建模块化智能体系统,支持异步或并行协作。在高风险请求触发时,暂停执行,转交人工审核。利用上下文(这些人)

2025-04-25 16:39:38 732

原创 Prompt实战之SQL问答系统3)从链到智能体 —— 构建 SQL Agent

假设你有一个 query_database 函数description="用于执行 SQL 查询,并返回结果"通过 ZERO_SHOT_REACT_DESCRIPTION 类型的 Agent,系统会自动推理是否需要使用工具。Thought: 我需要从数据库查询信息Observation: 返回了5条记录...Final Answer: 员工列表如下:...# Agent 1: SQL 生成器。

2025-04-25 16:39:04 923

原创 Prompt实战之SQL问答系统 2)引入人类审查流程(Human-in-the-Loop)

我们可以暂时用控制台输入模拟人类行为。后续也可以替换为 Web 审批、Slack 通知等更复杂系统。我们将在“生成 SQL 语句”与“执行查询”之间插入人工审查步骤。在第一章中,我们成功构建了一个完整的 SQL 问答系统。因此,在系统进入生产环境之前,我们应在关键步骤加入。表时,系统会中断流程并进入人工审批节点。LangGraph 支持流程中的。

2025-04-25 16:37:45 388

原创 Prompt实战之SQL问答系统1)项目介绍

在本章中,我们将从零开始构建一个可以使用自然语言查询数据库的应用。你将学会如何使用LangChain + LangGraph + OpenAI 大语言模型将用户问题转换为 SQL 查询;执行 SQL 查询并获取结果;将查询结果转换成用户可理解的回答。本项目采用 SQLite 格式的Chinook数据库作为示例数据源。

2025-04-25 16:37:07 2043

原创 Prompt工程论文:通过基于事实的归因与拒答学习,衡量并提升大语言模型在检索增强生成(RAG)中的可信度

论文地址:https://openreview.net/pdf?摘要:大语言模型(LLMs)是检索增强生成(RAG)系统的重要组成部分。虽然许多研究聚焦于评估端到端 RAG 系统的整体质量,但对于 LLM 在 RAG 任务中的适用性仍存在理解上的空白。为此,我们提出了,一个全面的度量标准,用于评估 LLM 在 RAG 框架中的可信度。我们的研究结果显示,诸如上下文学习等各种提示方法,并未有效地使 LLM 适应 RAG 任务,且其表现未能在 TRUST-SCORE 上取得良好结果。因此,我们提出了。

2025-04-23 20:09:56 745

原创 Prompt工程论文:REGENESIS-大语言模型可通过自我提升成长为通用推理专家

论文地址:https://openreview.net/pdf?摘要:通过引入显式推理轨迹对大语言模型(LLMs)进行后训练,可以增强其推理能力。然而,获取高质量的推理轨迹数据通常依赖于人类或更强大模型的精细监督,这不仅成本高昂,且可能受到授权限制。本文探索了在不依赖任何额外监督的情况下,LLM 能否通过自我合成推理路径作为训练数据来提升其推理能力。现有的自我合成方法(如 STaR)在处理域外(OOD)推理任务时存在泛化能力差的问题。

2025-04-23 18:12:20 672

原创 Prompt工程论文:在推理任务中,相较于扩展参数规模,优化大语言模型推理时的计算资源调度可能更加高效

论文地址:https://openreview.net/pdf?摘要:使大语言模型(LLMs)在推理阶段通过使用更多计算资源来自主优化输出,是构建能够处理开放式自然语言任务的自我改进型智能体的关键一步。本文聚焦于在推理阶段扩展计算资源,并探讨一个核心问题:若LLM在推理时被允许使用固定但非微不足道的计算资源,它在面对具有挑战性的提示时,能将性能提升到什么程度?这一问题的答案不仅影响模型的性能,还对未来的预训练策略及推理与预训练计算资源之间的权衡具有重要意义。

2025-04-23 18:01:33 617

原创 Prompt工程论文:从探索到精通-通过自驱交互使大语言模型掌握工具

论文地址:https://openreview.net/pdf?摘要:工具学习使大语言模型(LLMs)能够通过调用工具与外部环境进行交互,这是一种有效的策略,用以缓解其预训练数据所固有的局限性。在这一过程中,工具文档发挥着关键作用,它为LLMs提供使用说明,从而促进工具的有效使用。本文聚焦于一个关键挑战:由于现有以人为中心的工具文档存在不足与不准确性,LLMs与外部工具之间存在理解鸿沟。

2025-04-23 17:48:56 762

原创 Prompt工程之LangGraph 9)部署与集成

常见的 Web 框架,如 FastAPI 和 Streamlit,都是非常适合与 LangGraph 结合的工具。此时,我们可以设置一个专门的“进度状态”字段,传递给前端,以便用户能够实时看到执行进度。现在,FastAPI API 就已经搭建完成,可以通过 POST 请求调用 LangGraph 工作流,传入相应的输入数据。通常,前端发送的数据格式是 JSON 格式,包含工作流所需的输入信息。此时,用户可以通过 Web 界面输入数字并执行 LangGraph 工作流,结果将在页面上显示。

2025-04-21 14:29:45 453

原创 Prompt工程之LangGraph 8):LangGraph 的可视化与调试

在实际项目中,良好的日志记录能帮助你快速定位问题。LangGraph 与 Python 的标准日志库兼容,因此你可以轻松记录节点执行的日志。这个方法生成一个图形化的节点及连接,可帮助你在调试或设计阶段快速验证工作流逻辑。LangGraph 的节点可以返回状态信息,借此你可以追踪每次执行时的状态变化,帮助理解流程中数据是如何流动的。对于一个完整的 LangGraph 工作流,端到端测试确保整个流程的逻辑与状态流畅。模拟输入并检查最终结果。在处理复杂项目时,LangGraph 的调试可能会变得更加困难。

2025-04-21 14:28:28 460

原创 Prompt工程之LangGraph 7)LangGraph 应用实践

💡 小贴士:多个子图可独立构建,如“合同审核子图”“法规查阅子图”,便于后续组合使用。💡 小贴士:将反思意见与输出内容都保存到状态中,便于分析与迭代。LangGraph 不只是控制流程的工具,更是构建“📌 可通过中断恢复机制,实现异步审批挂起与唤醒。LangGraph 天然适合构建具有。LangGraph 特别适合处理。

2025-04-21 14:27:42 409

原创 Prompt工程之LangGraph 6):LangGraph + LangChain Agents

搜索 Agentsearch_tools = [Tool(name="WebSearch", func=fake_search, description="搜索网页")]# 解题 Agentsolver_tools = [Tool(name="Calculator", func=lambda x: eval(x), description="数学工具")]# 总结 Agent。

2025-04-21 14:26:55 271

原创 Prompt工程之LangGraph 5)LangGraph 的高级能力

在 LangGraph 中,add_conditional_edges。LangGraph 支持将一个图嵌套为另一个图的节点,实现模块化设计。💡 小贴士:条件跳转逻辑推荐保持简单清晰,复杂逻辑可封装到单独函数。📌 示例场景:构建一个“摘要模块”或“搜索工具模块”作为独立子图。LangGraph 图可中断保存状态、稍后恢复执行。架构,再加入评分与阈值判断逻辑。计数器来避免无限循环。📌 你可以参考第3章的。

2025-04-21 14:26:16 359

原创 Prompt工程之LangGraph 4)构建多角色协作系统

🔁 若草稿未通过审稿,系统将循环回到 Writer 重新生成,直到审核通过。

2025-04-21 14:25:41 408

原创 Prompt工程之LangGraph 3):构建你的第一个 LangGraph 应用

我们将这些节点添加到一个。

2025-04-21 14:24:50 425

原创 Prompt工程之LangGraph 2)LangGraph 的核心概念

")💡LangGraph 中节点函数通常接收并返回一个「状态」对象。2.3 边(Edge):控制流程走向的桥梁边用于指定哪个节点在完成后应跳转到下一个节点。固定跳转:从 A → B条件跳转:根据状态判断 A → B 或 A → C节点函数始终接收并返回状态;条件边可以让图变得「聪明」;状态是你设计智能体行为的「记忆存储器」;每个图结构都应明确入口与终点。

2025-04-21 14:24:07 434

原创 Prompt工程之LangGraph 1)初识 LangGraph

是由。

2025-04-21 14:23:31 407

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除