Meta号称替代程序员的LlamaCoder效果被CodeFlying秒杀,来看实测!

在讲LlamaCoder之前咱先浅聊一下Meta

这两天Meta凭借着Connect 2024大会可谓是风头正盛,刚刚发布的全新开源多模态大模型Llama3.2,热度是一路赶超咱的小草莓啊。

作为一款开源大模型能够和闭源的4o-mini、Claude3 Haiku打的有来有回,

甚至Llama 3.2中杯(90B)在图像任务的理解和处理上已经把Claude3 Haiku击败了。

好了点到为止,咱知道Meta在开源大模型这块子的实力就行,现在大家肯定会好奇了,

Meta这么牛,LlamaCoder虽然是基于Llama3.1开发的AI编码助手,但肯定实力也不差吧?

为啥标题要这么说?(我绝对不是标题党~)

实力确实不差,但是国内的CodeFlying码上飞(后简称CodeFlying)实力比他还豪横,

并非空口无凭,先来瞅个视频,然后请各位看官再细品下文~

后面会用图文的形式详细介绍CodeFlying开发应用的全过程,

有心急的小伙伴也可以点目录二、CodeFlying直接去看哦~

一、LlamaCoder

LlamaCoder是基于Llama 3.1的超大杯(405B)开发的开源AI编码工具,主要有以下几个能力:

  1. 代码生成:LlamaCoder能够根据用户的自然语言提示自动生成代码,支持Python、JavaScript等多种编程语言。

  2. 应用创建:用户可以根据自己的需求快速创建全栈应用程序,就是直接生成出来一个应用。

  3. 组件集成:LlamaCoder集成了Sandpack用于代码沙盒、Next.js用于应用路由、Tailwind用于样式设计,以及Helicone用于可观测性和分析。

  4. 数据驱动:支持数据分析和处理,帮助开发者更好地理解和优化应用程序 

其中最核心的能力就是可以通过描述来使AI生成一个应用程序,边写代码边预览应用的实际效果。

和Claude Artifacts差不多,但其实实测下来效果并不如Artifacts

链接附上:Llama Coder – AI Code Generator (together.ai)
感兴趣的小伙伴可以去体验一下。

进入到网站能看到在开发首页上就有一个醒目的提示词告诉大家,能够将想法变成应用程序(看起来好牛),

那接下来,咱就来实测一下LlamaCoder的真实能力,是不是他宣传的那样神乎。

先从最简单的功能测起,让他帮我开发一个可以add和delete的list清单

呃,效果似乎一言难尽,基本的样式是有了,操作也有了就是这个逻辑吧似乎有点问题,

我remove一个任务之后,会自动新建一个任务,且remove按钮的校准也有问题。

而且是英文的,看着比较变扭,不过也有可能是我提问的原因。

那我在试着完善一下,毕竟不能一步到位嘛(划重点,后面要考)

这样看着好像顺眼多了,但是功能还是有点问题。那就先不管了,我们换别的任务让他开发一下看看。

直接告诉他帮我开发一个小游戏,看着好像是搞了个贪吃蛇出来,

试一下能不能用,不过结果好像有点尴尬,这玩意儿好像就是个button的样式,完全不能运行。

于是我又继续提问,让他生成的这个应用能够供我在线体验。

结果给我生成了一个XO的小游戏,体验了一下,能玩倒是能玩,哪方赢了还会有结果显示出来,就是当遇到平局的时候他就没法处理了。

小功能都试过了,再试试能不能开发出来一个复杂一点的程序。

我告诉他我想开发一个缺陷管理系统,能够记录缺陷的信息,设置缺陷的发现人,处理人以及缺陷的处理时间和优先级。

生成出来了,来体验一下看看效果(这次不用提醒他用中文,给个好评) 

效果还是不错的,生成出来了一个可编辑的表单,并且添加的缺陷会记录到列表里,

在时间的选择上也是直接生成出了一个时间选择器。

接下来试一下,继续让AI完善这个应用,

还是有说法的,我们要的功能基本都实现了,但是他自己给我配置了几个人名,少了一个delete的功能。

继续来试一波难度高一点的需求,将刚才的几个功能点结合起来,再加上几个新的想法,看看能不能一口气直接跑出来。

先把需求列出来:

我想开发一个缺陷管理系统,它能够记录缺陷的信息,设置缺陷的发现人,处理人以及缺陷的处理时间和优先级,同时具备上传附件图片的功能。可以由我自己配置发现人和处理人的信息,要具备删除缺陷的功能,以及删除人员信息的功能。同时每个缺陷可以关联一个项目,一个项目下可以有多个缺陷,点击项目的详情能查看这个项目下所有的缺陷信息。

这次我直接把整个开发的过程都录了下来,我们能在沙盒里看到他确实在猛猛的写代码,从代码里面也能看到我们提到的一些功能。但是最后还是没能把这个应用跑出来。

二、CodeFlying

那接下来,我们就直接试一下CodeFlying的效果吧,

对于CodeFlying我就用一句话简单的介绍一下,因为相信大家看完之后,一定会自己去了解CodeFlying到底是何方神圣了。

CodeFlying,是国内首发的文生软件平台,一句话就能生成一个完整的应用程序。

我直接把刚才发给LlamaCoder的需求甩给了CodeFlying的AI,他明确的识别出了我想要做的应用,并给出了一个叫做“缺陷管理系统”的解决方案

从这两段对话中可以看出AI把需要开发的页面和功能都罗列了出来,并且向我发出了确认需求的提示。

然后AI就直接开始设计这个应用程序了,并且有3个agent直接参与了应用在需求阐述、研发以及测试验收环节的工作。

点开下拉能看到agent给出的具体设计方案,这里就不展示出来了,后面会有一个视频供大家预览。

直接点击确定设计,开发应用。

应用开发完了之后,还直接给咱部署了出来,来体验一下看看。

(跟开头的视频是一个哦~)

不得不说确实牛啊,如此复杂的需求,直接一步到位了,功能都完美实现了不说,甚至在ui上还有自己的设计。

更重要的是,竟然直接开发出了前端和后端,我滴个乖乖

在两端之间切换的非常丝滑,并且使用起来一点延迟都没有。

甚至连登录系统都给我做出来了(我都没提...)

直接就是一个AI干了一个项目组的活呀这是。

更牛的是看这个

开发完应用之后,还可以下载这个应用的前后端代码,并且前面几个agent生成的设计文档都可以直接拿走。 

压缩包里包含了应用源代码,产品需求文档,架构设计文档,产品测试用例以及部署运维文档(连部署和运维都考虑到了这是我没想到的)。

总而言之就是一个字 震撼!

老实说,在写这篇文章的时候我已经开始期待用CodeFlying开发出各种各样的应用了。

三、总结

再来总结一下这次测评

LlamaCoder的效果整体来说也还不错,几个小的功能点测试都达到了预期的水平,

但是在生成一个具有多个复杂功能的应用上就有点捉襟见肘了,

并且它的代码只能生成245行,另外就是目前也只能生成react项目。

和他的竞品Claude Artifacts比起来还有点小差距,当然也有可能是因为模型的原因,毕竟 Artifacts用的是自家的闭源中杯模型嘛。

而CodeFlying的表现想必不用我多说了吧,整个开发过程,体验的流畅度都摆在这里,

相信大家对CodeFlying能力的期待值也拉满了,那这里我就放上链接供大家去体验一下咯。

码上飞 CodeFlying | AI 智能软件开发平台!

创作不易~大家点点关注呀!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值