AI程序员还是代替不了程序员，震撼硅谷的Devin-ai程序员，再度震撼硅谷——但这次是被打假

最新推荐文章于 2024-07-20 13:47:44 发布

奶糖肥晨

最新推荐文章于 2024-07-20 13:47:44 发布

阅读量672

点赞数 11

文章标签： ai AI编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48998573/article/details/140149249

版权

在这里插入图片描述

文章目录

- 主要疑点包括但不限于：
- 35年从业者逐帧验证

AI程序员还是代替不了程序员，震撼硅谷的Devin-ai程序员，再度震撼硅谷——但这次是被打假

一位油管程序员博主Internet of Bugs对Devin发布的视频进行了逐帧分析，逐一举证说明了Devin并不如演示中那般拥有程序员开发能力。

甚至有“自己现写bug然后当场修复”的骚操作。

主要疑点包括但不限于：

号称能解决任何Upwork任务，但演示中解决的问题并不是prompt要解决的那一个，做无用功；
看起来在修复bug，实际上修复的bug人类程序员根本就不会犯；
没有意识到简单两步就能解决问题，花里胡哨一顿操作，其实是自己把任务搞复杂了；
修改代码的水平一言难尽。
Devin所处理的任务并非随机，而是精心挑选；与客户实际需求有很大的出入

Internet of Bugs花了半个多小时，把Devin演示视频中的upwork任务完成了一遍——而Devin完成任务可能用时6个多小时。

要知道，其背后公司Cognition AI手握10块IOI金牌的活招牌，还在推出Devin当月宣布成功融资2100万美金。

推特和YC上已经吵翻天了，让这件事的讨论度高居不下。

演示造假让demo看起来轻松达到意料之外的技术进步。

35年从业者逐帧验证

此次出来声张正义的Internet of Bugs，从事软件行业已经35年。他首先声明自己的立场：“我并不反对高科技，但我确实反对过度炒作”。

他自己也经常使用GitHub Copilot、ChatGPT、LIama2、Stable Diffusion。

此次则主要针对的是一些更为具体的说法。

比如之前Devin号称能够靠处理upwork任务来赚钱的。但在真正的演示中Devin并没有做到这一点。

不信？没关系，Internet of Bugs带着逐帧的证据来了。

总结如下：

Devin所处理的任务并非随机，而是精心挑选；

与客户实际需求有很大的出入；

实际操作过程，数次自己创造bug然后再修复；

很多毫无意义的操作，相当于几十年前在C语言中才用的方法；

首先，来到了演示视频的2.936秒处，在屏幕左上角有显示他们搜索过这个内容。因此，这不是所谓“随机”选择的任务。

再来看客户给到的具体需求。真正需求为“我想要利用这个库来进行推理。你需要提供详细的操作指南。我不想讨论完成这项工作预计需要的时间。”

但给到Devin的需求却是：我希望利用这个模型在这个库中进行推理。请自己弄明白。

最后视频末尾出现的Devin生成报告中，也没有提及客户实际需要的内容。

那么，这份工作的最终交付成果应该包括什么呢？

但Devin实际做了什么？

Devin第一次真正的尝试，是它修改了一个名为requirements.txt文件,其中规定了代码所依赖的库版本。视频中提到它正在更新代码，但实际上更像是修改配置文件。

然后根据需求，需要Devin能建立自己的推理能力，并仅需使用样例数据即可。但实际项目要比这个复杂得多。

结果很快，Devin就遇到了第一个命令行错误——打开图像失败、文件未找到、无此文件或目录等。但在光头哥实际复现时并没有出现，结果研究发现，代码仓库压根就不存在这个文件。

这相当于Devin自己创建了个bug，然后再修复bug。在接下来的操作中，Devin经历了很多次这样的“自建自修”。

不能说十分有用，只能说完全没有必要。

接下来，再来看看代码库中这样一个readme文件。正如视频所展示的那样，readme文件清晰地说明了该文件的功能和用法。在页面右侧,甚至还有一个小按钮，点击它就可以复制整条命令，然后粘贴到命令行窗口中，按下回车即可运行。

但Devin完全没能理解，而又是自创了个项目。而写的那段从缓冲区读取数据的代码十分糟糕。

于是Internet of Bugs发出了灵魂拷问：

“这不就是几十年前在C语言等中才用的方法吗？？？”

这种做法显然已经过时，正常人用Python谁还会再写这个代码。这种代码很难调试，它逻辑复杂，难以理解，很容易出现细微的错误。

此外，代码库中还存在一个真正的错误，但Devin既没有发现也没有修复。

然后Internet of Bugs用谷歌搜索，按照GitHub 上一条相关评论修改了代码，只花了1分07秒，问题就解决了。

最终Internet of Bugs总共花了35分55秒复现了Devin的工作，而Devin实际花了多长时间呢？

如果细看视频Demo，就会发现Devin处理工作前后有6个小时20分钟的间隔。

视频的前部分显示的是3月9日下午3：25 的时间戳，但后半部分却显示的是当天晚上9：41。

而逐帧细看就有会发现一些奇怪且毫无意义的操作。

比如head -N 5 results.json | tail -N 5这个命令，它表示取这个JSON 文件的前五行，然后再取这些行的最后五行。

正确的做法应该是”head-5 results.json”。那个-N 是多余的。只要说-5就可以，不需要那些多余的东西。

最后Internet of Bugs锐评，AI现在生成的内容有很多都十分愚蠢，反倒会让事情变得更为复杂。

当看到它的任务列表时，会觉得：哇，Devin做了很多事情。但实际上可能并非如此。

网友：至少掌握了看起来很忙的技巧

对于此次Devin造假翻车，不少网友对现阶段AI产品炒作嗤之以鼻。

你对此这么看？

参考链接：
https://www.thepaper.cn/newsDetail_forward_27026926

您好，我是肥晨。
欢迎关注我获取前端学习资源，日常分享技术变革，生存法则；行业内幕，洞察先机。

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
AI程序员还是代替不了程序员，震撼硅谷的Devin-ai程序员，再度震撼硅谷——但这次是被打假

一位油管程序员博主Internet of Bugs对Devin发布的视频进行了逐帧分析，逐一举证说明了Devin并不如演示中那般拥有程序员开发能力。Internet of Bugs花了半个多小时，把Devin演示视频中的upwork任务完成了一遍——而Devin完成任务可能用时6个多小时。号称能解决任何Upwork任务，但演示中解决的问题并不是prompt要解决的那一个，做无用功；这种代码很难调试，它逻辑复杂，难以理解，很容易出现细微的错误。当看到它的任务列表时，会觉得：哇，Devin做了很多事情。
复制链接

扫一扫

奶糖肥晨 CSDN认证博客专家 CSDN认证企业博客

码龄4年

前端领域优质创作者

314: 原创

253: 周排名

3480: 总排名

74万+: 访问

: 等级

6951: 积分

2万+: 粉丝

2749: 获赞

1139: 评论

3951: 收藏

私信

关注

热门文章

分类专栏

内容参考付费 55篇
uniapp 29篇
git 7篇
书籍推荐 3篇
node 11篇
鸿蒙开发学习 4篇
vue2后台管理系统项目从0-1 1篇
js 52篇
vue 45篇
vue3 17篇
设计模式 2篇
vant 3篇
面试题 23篇
JAVA 4篇
HTML 2篇
小程序 4篇
优化 1篇
web 3篇
漫画技术文
md 1篇
nvm 6篇
el-element 16篇
微信小程序 2篇
css 19篇

最新评论

uniapp bug解决：uniapp文件查找失败:‘uview-ui‘ at main.js:14
LeoToJavaer: 非常喜欢这篇博客！博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点，对我来说非常有帮助。尤其是博主在文章中提供了很多实际操作的步骤和技巧，让我能够更好地应用所学的知识。同时，博主的配图也很精美，更加生动地展示了文章中的内容。总之，非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
[保姆级教程]uniapp安装使用uViewUI教程
LeoToJavaer: 非常喜欢这篇博客！博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点，对我来说非常有帮助。尤其是博主在文章中提供了很多实际操作的步骤和技巧，让我能够更好地应用所学的知识。同时，博主的配图也很精美，更加生动地展示了文章中的内容。总之，非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
uniapp判断h5/微信小程序/app端+实战展示
LeoToJavaer: 你的文章给我带来了很大的启示和思考，写得非常棒，期待你更多的作品。
uniapp微信小程序分享教程
CSDN-Ada助手: 推荐小程序技能树：https://edu.csdn.net/skill/mini_programs?utm_source=AI_act_mini_programs
uniapp微信小程序分享教程
LeoToJavaer: 博主的文章细节很到位，兼顾实用性和可操作性，内容和细节都很到位，期待博主持续带来更多好文

大家在看

苹果CMS影视站SEO详细优化教程

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

奶糖肥晨 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。