跟着大佬吴恩达教授玩转智能体

最新推荐文章于 2024-08-31 23:13:29 发布

程序员笑武

最新推荐文章于 2024-08-31 23:13:29 发布

阅读量807

点赞数 9

文章标签：人工智能搜索引擎百度语言模型自然语言处理

本文链接：https://blog.csdn.net/m0_59164304/article/details/140807305

版权

大佬动手做了个翻译Agent

人工智能领域领军人物、斯坦福大学教授吴恩达（Andrew Ng），近日发布了一个机器翻译智能体开源项目——translation-agent。该项目实现了一个基于反思工作流的大模型翻译应用。

目前，该项目已经获得了 3.6k Star，在研究团队有限的测试中，即有不错的表现。要知道，这还只是吴恩达利用几个周末捣鼓出来的项目，还处于早期原型阶段，如能深入研究，一定会有更加优异的表现。

translation-agent 项目的核心是一个反思性代理工作流，它利用大型语言模型（LLM）进行文本翻译，并通过自我反思来提出改进建议，进而优化翻译结果。

该项目基于 Python 开发，主要步骤如下：

1. 输入 prompt，使 LLM 将文本从 source_language 翻译成 target_language；

2. 让 LLM 反思翻译结果，并提出建设性改进建议；

3. 利用这些建议改进翻译。

机器翻译目前存在的问题是文字生硬、内容晦涩，也就是通常说的“机翻感”，其实上述过程的第一步产出的就是这类结果。

而基于反思工作流技术，则可以实现高度定制，轻松改变翻译的风格、处理特定术语和方言，以适应不同的翻译需求，使得结果看起来更接近母语的自然表达。

AI 技术爱好者可以轻松搭建 translation-agent 运行环境，首先安装 Poetry 包管理器和配置环境变量，然后通过简单的 Python 脚本调用translation-agent的 API 进行翻译。例如，用户可以指定源语言、目标语言、国家和待翻译的文本，然后获取翻译结果。

调用translation-agent接口示例

大佬提出Agent的四种设计模式

吴恩达教授认为 AI 最具前景的发展方向，就是基于大模型的 Agent 应用。当前大模型已经具备了足够智能的生成能力，但简单的“一问一答”形式并不能很好地解决复杂问题，而 Agent 能充分发掘大模型的潜力，实现多功能智能应用。

吴恩达总结和介绍了四种较为常见的设计模式，分别是反馈(Refection)模式、工具调用(ToolJse)模式、规划(Planning)模式和多智能体协作(Multi-agent colaboraion)模式。

反馈模式

这是让 AI 模型通过自我反思和迭代改进来提高任务执行能力的方法。模型不仅生成初始解决方案，还会通过多次反馈和修改，不断优化其输出。translation-agent 项目就是典型的反馈模式应用。

工具调用模式

这是让 AI 模型通过调用外部工具或库来增强任务执行能力的方法。模型并不仅仅依赖于自身的知识和能力，而是利用各种外部资源来完成任务，从而提高效率和准确性。

规划模式

这是通过提前计划和组织任务步骤来提高效率和准确性的方法。模型将复杂任务分解为多个步骤，并依次执行每个步骤，以达到预期的目标。

多智能体协作模式

这是通过多个智能体之间的合作来提高任务执行效率和准确性的方法。多个智能体分担任务，并通过相互交流和协作，共同完成复杂任务。

看明白了 Agent 设计模式，可怎么才能开发出有用的智能体应用呢？只要看懂一本书就可以，我们现在就来学会动手做 Agent。

一本书学会动手做Agent

《大模型应用开发：动手做AI Agent》是一本全面而深入探索 AI Agent 的指南。本书基于大模型技术，详细阐述了 AI Agent 的设计、开发和应用，涵盖了从基础理论到高级应用的各个方面。

书中首先介绍了 AI Agent 的基本概念，探讨了它们如何作为智能系统的关键组件来模拟人类的决策和交互过程。随后，作者深入讨论了大模型作为 Agent “大脑”的角色，以及如何利用这些模型的通用推理能力来构建高度智能的 AI 系统。

本书不仅阐述理论，还通过 7 个具体的实践案例展示了 AI Agent 在自动化办公、客户服务、个性化推荐、智能调度等多个领域的应用。读者将学习到如何使用 OpenAI API、LangChain、LlamaIndex 等工具来开发具有感知、规划和行动能力的 Agent。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

程序员笑武

关注

9
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
跟着大佬吴恩达教授玩转智能体

人工智能领域领军人物、斯坦福大学教授（Andrew Ng），近日发布了一个机器翻译智能体开源项目——。该项目实现了一个基于反思工作流的大模型翻译应用。目前，该项目已经获得了 3.6k Star，在研究团队有限的测试中，即有不错的表现。要知道，这还只是吴恩达利用几个周末捣鼓出来的项目，还处于早期原型阶段，如能深入研究，一定会有更加优异的表现。translation-agent 项目的核心是一个反思性代理工作流，它利用大型语言模型（LLM）进行文本翻译，并通过自我反思来提出改进建议，进而优化翻译结果。
复制链接

扫一扫