如果你已经掌握了 Python 101,那么你可能比 OpenAI 的原型 Codex 更擅长编程

OpenAI 警告说,它的 Codex 神经网络,就像为 GitHub 的代码完成工具 Copilot 提供动力的神经网络一样,可能会生成看似合理但不正确的源代码,并且其性能会随着规模的增长而下降。

人工智能实验室在本周的预印本论文中揭示了其 Codex 模型非生产构建的缺点和局限性。应该注意的是,该系统的一个独特的生产变体为GitHub Copilot 提供动力;论文中讨论的初步模型较小,仅在 Python 上进行了训练,而 Copilot 接受了更多数据的训练,并支持一系列编程语言的代码完成。

尽管如此,GitHub Copilot 也面临着与 Codex 原型类似的问题。也就是说,生成的代码在第一次尝试时不太可能对开发人员来说是正确和有用的,而且它往往会提出乍一看似乎合理但可能是错误的响应。程序员应该仔细检查自动编写的代码是否有任何错误。

为了测试模型的 AI 结对编程技能,研究人员提出了 164 个手写编程问题,这些问题检查了 Codex 完成功能、理解简单算法和计算数学查询的能力。

该系统最强大的版本拥有 120 亿个参数,在首次尝试时能够解决 28.8% 的问题。相比之下,OpenAI 的 GPT-3 自然语言系统无法解决其中任何一个问题。

然而,当 Codex 能够生成更多响应时,它的表现确实更好。在 10 次尝试中,它给出了 46.81% 的正确答案,在 100 次尝试中,这个数字上升到 72.31%。

GitHub Copilot 是人工智能结对编程,你,人类,仍然需要做大部分工作

GitHub Copilot 自动编码器出现问题,从看似泄露的秘密到糟糕的代码,但有些人喜欢它

微软将花费所有资金的 OpenAI 的 GPT-3 用于 Power Fx

如何在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值