大模型Agent算法学术工业技术前沿
文章平均质量分 93
立足大模型Agent算法双前沿,兼顾学术深度与工业温度,既有理论拆解,也有实践干货,覆盖科研、技术、行业从业者,陪你一起见证Agent技术从理论到实践的每一步跨越,紧跟技术浪潮不落后
DFCED
专注于人工智能/大模型/Agent领域,qs20高校博后,qs50高校副教授,顶会顶刊审稿人编辑,在顶会顶刊累计发文50余篇
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
OpenClaw(原ClawdBot/MoltBot) 最全详细全解:从聊天机器人到个人 AI 操作系统的技术革命
OpenClaw(原 ClawdBot/MoltBot),是一款以“本地优先、AI 驱动、多端协同”为核心的开源个人 AI 操作系统——它不是简单的聊天机器人,而是具备“思考(AI 推理)、动手(设备控制)、记忆(持久化记忆)、主动(自主调度)”能力的智能中枢,能跨渠道、跨设备,自主完成文件处理、远程控制、自动化办公等复杂任务,让 AI 真正融入生活、解放双手。如果你是技术极客,不妨部署体验,探索其模块化架构与技能开发的乐趣;原创 2026-02-08 16:45:49 · 663 阅读 · 0 评论 -
OpenClaw部署实战:5分钟搭建你的专属AI数字员工(附避坑指南)
OpenClaw,这个在2026年初引爆AI圈的开源项目,正在重新定义“个人AI助手”的边界。不同于传统的聊天机器人,OpenClaw是一款开源、本地优先的自主AI代理与自动化平台,其终极目标是构建“个人AI操作系统”。原创 2026-02-07 22:46:35 · 840 阅读 · 0 评论 -
Anthropic万字长文:大模型智能体评估的最全原理详解
术语定义任务(Task)单个测试,包含明确的输入和成功标准(又称问题或测试用例)尝试(Trial)对单个任务的一次执行。由于模型输出存在随机性,需多次尝试以获得稳定结果评分器(Grader)衡量智能体性能某一方面的逻辑。一个任务可包含多个评分器,每个评分器含多个断言(又称检查点)记录(Transcript)一次尝试的完整记录,包括输出、工具调用、推理过程、中间结果及所有交互。Anthropic API中表现为评估结束后的完整消息数组结果(Outcome)尝试结束时环境的最终状态。原创 2026-02-01 20:40:49 · 1002 阅读 · 0 评论
分享