继Devin之后又一AI工程师:Genie横空出世!

QQ截图20240813140300.jpg

COSINE团队

继 Devin 之后,一个名为Genie的AI软件工程师横空出世,以其惊人的性能和能力,一举夺得"地表最强AI软件工程师"的桂冠。据官方介绍有着超强性能的它可以直接吊打“Devin”,那么这个传言真的属实吗?我们接着往下看。

Genie

QQ截图20240813140458.jpg

数据测试对比

Genie 的出现无疑给AI编程领域带来了一股新的旋风。在权威的 SWE-Bench 评测中,Genie 以30.07%的惊人成绩傲视群雄,不仅远超第二名19.27%的成绩,更是将 Devin 的13.8%远远甩在身后。这个成绩意味着什么?它象征着 Genie 在解决实际软件工程问题上的能力已经达到了一个前所未有的高度。

它的核心优势在于能够像人类工程师一样思考和行动。这种能力源自于 Cosine 团队独特的训练方法——他们花费近一年时间,收集并整理了大量真实人类程序员的开发活动数据。这些数据不仅包含了代码本身,更重要的是捕捉到了人类工程师解决问题的完整思维过程。

想象一下,Genie 就像一个超级学霸,它不是简单地背诵答案,而是深入理解了解题的每一个步骤和思路。这使得 Genie 在面对各种复杂的编程挑战时,能够展现出近乎人类的智慧和创造力。

Genie与OpenAI

QQ截图20240813140527.jpg

Genie使用界面

Genie 的另一个制胜法宝,是它采用了基于 OpenAI 最新 GPT-4o 的长上下文模型。这意味着 Genie 能够处理更长、更复杂的代码和指令,从而在解决大型项目或者遗留系统的问题时展现出色的表现。

QQ截图20240813140638.jpg

发文感谢OpenAI

他们的 CEO 也是直接出面发文感谢,声称“如果没有 OpenAI 团队的帮助,那么 Genie 就不可能制造出来”。

自我撰写+改进

QQ截图20240813140552.jpg

Genie使用时的界面

Genie 的强大之处还在于其自我改进机制。通过不断生成包含错误的合成数据,然后利用这些数据训练新一代模型,Genie 实现了一种类似于"自我对弈"的进化过程。这就好比一个永不疲倦的学习者,不断从自己的错误中吸取教训,最终达到近乎完美的境界。

这种自我进化的能力使得Genie在面对各种复杂的编程任务时,能够展现出惊人的适应性和创造力。无论是修复bug、重构代码,还是构建全新的功能,Genie都能够游刃有余地应对。

在实际应用中,它的表现更是令人瞠目结舌。有报道称,Genie 能够在短短84秒内完成从问题分析到代码生成的全过程。这种效率简直就是程序员们梦寐以求的"神器"。

面对 Genie 的横空出世,业界反应可谓褒贬不一。有人认为 Genie 代表了AI编程的未来,将彻底改变软件开发的方式;也有人对其实际应用效果持保留态度,认为在复杂的实际项目中,AI 还难以完全替代人类程序员的创造力和洞察力。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值