2024.4.14
从第一性原理看大模型Agent技术
作者:邓范鑫
推荐指数:⭐️⭐️⭐️⭐️⭐️
推荐理由:有综述,有方向预判、通用智能思考框架,覆盖度比较好,
- 视频版本
从第一性原理看大模型Agent技术
作者的目录,如下
阅读思考
- 作者从计算机技术发展的视角看,是从面相过程的架构,转变为 面向目标的架构;从产品角度看,目标是按照意图进行设计,按照问题-解决方案的方式,找到求解。
- 其中提到的算术题,2024.4月复测不通过(部分LLM),这种符号型智能的推理确实是弱项;
- ChatGLM 4,失败,每一步都出错,个十百千的按位加减都出错;
- 文心一言3.5,
- 第一次测试,没有给过程,只给出了计算的文字逻辑,结果是对的
- 第二次测试,需让LLM给出过程,只给出了3个步骤,后续不给出,理由是大数计算;
- 第三次测试,到百位时,就出错了。
- 推测,应该是检测到大数计算,后台调用工具完成计算了。
给小学生展示一下两数相加的每一步计算过程,如1135 + 78
答:计算详细过程如下
5+8=13, 进位1
3+7+1=11, 进位1
一个数已经加完,剩余数11 + 1 = 12
结果为:1211
下面请列出以下两数的详细计算过程:
81728738271872871871672 + 28781729836746721
- 外部工具API化被集成调用(按照web3价值分配,需要调研其它文章做具体分析),垂直应用场景场景仍然存在,但是应用生态将发生变化,以API的形式被Agent调用,或者垂直的Agent代理间协作;
- 进入社会后,产品化要去分析垂直场景的环境对接部分,包括多模态、时空性质、Action和反馈;
阿里云AI Agent开源!如何基于开源大模型搭建自己的智能体?
阿里云AI Agent开源!如何基于开源大模型搭建自己的智能体?_哔哩哔哩_bilibili
后续需要做具体POC实践;
参考文档