背景
Devin是一个能够执行复杂工程任务并与用户在软件开发项目上积极合作的自主人工智能软件工程师,它擅长planning、tool use、reflecting,碾压大部分初级开发。
设计思路
一、界面设计
先来看 Devin 的界面,左边是对话框,记录了用户的提问和 Devin 的思考过程,右侧是 Devin 的工作空间,包含 Shell、Browser、Editor、Planner。
二、任务规划
最大的亮点是 Planner,支持宏任务和微任务。Current Focus 记录了 Devin 正在执行中的宏任务,Macro Plan 是 Devin 记录的宏任务,Micro Plan 是 Devin 基于当前宏任务分解的多个微任务。和 JavaScript 一样,只有微任务执行完,才会执行下一个宏任务,微任务的优先级高于宏任务,可以确保一些重要的操作能够快速响应。当然 Devin也会根据情况调整任务规划,保证任务顺利完成,如下图所示。
比如我们让 AI 规划一个系统开发的计划,提示词可以这样写:
## 背景
我要做一个不规则 excel 填报系统项目,请先帮我把这个项目分解成不同的宏任务,把第一个宏任务记为当前任务,并对当前任务根据情况分解为一个或多个微任务。
## 输出要求
宏任务和微任务都用一句话表示,不要有子任务,输出时按照示例中的格式,不要有多余的内容。
## 输出示例
宏任务:
1. 洗菜
2. 切菜
3. 炒菜
当前任务:
洗菜
微任务:
1. 洗萝卜
2. 洗青菜
3. 洗黄瓜
结果如下,我们可以将其存储到数据库,方便AI记录和查询。
三、工具使用
Devin 能够使用的工具就是 Shell、Browser和Editor,Shell 用于配置开发环境,执行代码,观察执行结果,Browser 用于浏览文档,Editor用于编辑代码。
下图就是 Devin 通过Shell配置开发环境的过程。
实际上,我们可以让大模型使用各种各样的工具来提高任务的完成率,如下图所示。
四、反思调整
我们开发时经常遇到的报错,AI 同样也要面对。AI 通过观察反思,对代码进行修改测试,如下图所示。