Devin AI程序员是如何设计出来的

背景

Devin是一个能够执行复杂工程任务并与用户在软件开发项目上积极合作的自主人工智能软件工程师,它擅长planning、tool use、reflecting,碾压大部分初级开发。

设计思路

一、界面设计

先来看 Devin 的界面,左边是对话框,记录了用户的提问和 Devin 的思考过程,右侧是 Devin 的工作空间,包含 Shell、Browser、Editor、Planner。

image.png

二、任务规划

最大的亮点是 Planner,支持宏任务和微任务。Current Focus 记录了 Devin 正在执行中的宏任务,Macro Plan 是 Devin 记录的宏任务,Micro Plan 是 Devin 基于当前宏任务分解的多个微任务。和 JavaScript 一样,只有微任务执行完,才会执行下一个宏任务,微任务的优先级高于宏任务,可以确保一些重要的操作能够快速响应。当然 Devin也会根据情况调整任务规划,保证任务顺利完成,如下图所示。

image.png

比如我们让 AI 规划一个系统开发的计划,提示词可以这样写:


## 背景
我要做一个不规则 excel 填报系统项目,请先帮我把这个项目分解成不同的宏任务,把第一个宏任务记为当前任务,并对当前任务根据情况分解为一个或多个微任务。

## 输出要求
宏任务和微任务都用一句话表示,不要有子任务,输出时按照示例中的格式,不要有多余的内容。

## 输出示例

宏任务:
1. 洗菜
2. 切菜
3. 炒菜

当前任务:
洗菜

微任务:
1. 洗萝卜
2. 洗青菜
3. 洗黄瓜

结果如下,我们可以将其存储到数据库,方便AI记录和查询。

image.png

三、工具使用

Devin 能够使用的工具就是 Shell、Browser和Editor,Shell 用于配置开发环境,执行代码,观察执行结果,Browser 用于浏览文档,Editor用于编辑代码。

下图就是 Devin 通过Shell配置开发环境的过程。

image.png

实际上,我们可以让大模型使用各种各样的工具来提高任务的完成率,如下图所示。

image.png

四、反思调整

我们开发时经常遇到的报错,AI 同样也要面对。AI 通过观察反思,对代码进行修改测试,如下图所示。

image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

热爱技术的小胡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值