马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

大概也只有马斯克敢了。

用微软论文当证据,起诉OpenAI。

一年前微软研究院发表的论文《Sparks of AGI:Early experiments with GPT-4》,现在成为了马斯克起诉书中的关键角色。

这篇论文通过分析早期GPT-4的能力,认为GPT-4可以被视为早期AGI

0117e14f2492dbf6e3bed457280d5f71.png

去年论文发表时就引发不小关注,1年时间里被引次数已经高达1500次。

马斯克的起诉书里写道,微软自己的科学家自己都承认了。

846f6972a46d7a1370c8bb69f22ed9f0.png

这么看,OpenAI最新的一通回应不是啪啪自己打脸?

还真不一定。

这篇《Sparks of AGI》当初爆火确实不假,但其中很大一部分热度来自争议

不少人觉得它不够严谨、在炒热度,而且这篇论文没有经过同行评议,只是上传到了arxiv,结果也无法复现。

所以这篇论文到底说了啥?马斯克凭啥敢拿它大做文章?

论文说了啥?

这篇论文主要测试了GPT-4在2022年秋季的一个早期版本。

研究提出,GPT-4不仅掌握语言能力,而且能解决复杂新奇的问题,任务可以跨数学、编码、医学、法律、视觉等。

在这些任务中,GPT-4的表现接近于人类水平,大大超越以往LLM性能,比如ChatGPT。

由此,研究给出了关键性结论:

我们认为它可以被合理地视作一个早期版本(仍不完整)的AGI。

在此基础上,研究团队还进一步探讨了真正意义上的AGI应该具备哪些要素。

823734bebaecae1ac7ad96ae6c9e7e13.png

论文全篇超过150页,分别测试了GPT-4的多模态、代码、数学、常识等能力,通过大量实例得出结论。

以测试代码能力为例,GPT-4和ChatGPT会得到同样的提示词,研究人员将会对回答结果进行分析。

GPT-4的一些数据结果非常值得关注。

比如在零样本下,GPT-4代码能力在HumanEval上的精度达到82%。

3b32fb3f7192fed65c259ffd6d658837.png

再比如在现实问题问答中,GPT-4的表现也远好于ChatGPT。

7b00f75aac11130b6ef298c337d2c2b9.png

研究还讨论了GPT-4基于自回归架构表现出的局限性。

比如模型本身具备相应的知识能力,但是却会回答错问题,因为预测下一个token的机制使得模型不能进行“内心对话”。

ce3c0eaf800137987a99fbdc2bd47a1e.png
52aa90a40a3d7633772da75b9e90aedb.png

最后,论文作者还提出了对AGI的一系列构想。

这篇论文发表于GPT-4面世的一周后,当时引发业界巨大关注。

“AGI的闪现”让不少人感叹,一切都结束了。

32a7010c759bc085f71a3ef01e45e275.png

但质疑也不少,很多人觉得这个结论是不是有点夸大其词了?

60bd4d7b383126d088d133d8de1a34f3.png

而且研究团队承认使用的一些测试方法不够科学严谨,他们主要是想展示GPT-4卓越的能力。

0797d00aac739c1dd08cacdd3f7afce9.png

不过可以肯定的是,这篇论文成功把GPT-4和AGI强关联,给GPT-4创造了更多讨论热度,也成为AGI讨论热潮的重要推力。

可是谁又能想得到,它现在倒成为马斯克起诉OpenAI的关键了。

马斯克到底想干啥?

马斯克搞事,总是醉翁之意不在酒。

去年他和千名大佬共同呼吁暂停开发AI半年,结果转头自己囤卡、开搞大模型,火速成立AI初创公司xAI。

今年起诉OpenAI,核心的目的就是督促其开源。

号称GPT-4是AGI也是给OpenAI上道德压力。一方面要求他们开源,另一方面提出“AGI算法不应该授权给微软”。

f091280d177f498b2ea74a18869da477.png

所以有人合理怀疑,这场官司“会让一切减速”。

bb334ff9da847617b82e8a70b6e9a903.png

与此同时,马斯克的Grok也还在稳步推进中,目前已发布Grok-2。

值得一提的是,去年OpenAI宫斗前后,马斯克曾在一场访谈中表示,从现在(23年12月)算起,AGI还有不到3年

但往小了说,写小说和JK罗琳一样好、能发现新物理规律或发明新技术的AI,从现在算起还有不到3年。

当时他还表示觉得山姆·奥特曼很复杂。

目前,OpenAI方面除了否认GPT-4是AGI外,还没有更多回应。

有法律专家认为,马斯克列出的一系列观点,很难当成明确的条款来执行。“诉讼可能比较牵强”,但是提出了“强有力的政策论点”。

有圈内大V还觉得马斯克这么干,有点吃不到葡萄说葡萄酸。

b3236547aa435e66066473fa8d7bfba0.png

马库斯则调侃说,马斯克这么做逼得OpenAI不得不承认自己没达到AGI,但是可以找第三方来承认。

比如雇我这样的人来拯救他们。

f5262c300d2bfa61790f7837aa305bc7.png

参考链接:
[1]https://www.nytimes.com/2024/03/02/technology/elon-musk-openai-lawsuit-microsoft-research.html?unlocked_article_code=1.Zk0.M61l.NCnK2nvYNoUS&smid=url-share
[2]https://arxiv.org/abs/2303.12712
[3]https://www.courthousenews.com/wp-content/uploads/2024/02/musk-v-altman-openai-complaint-sf.pdf

报名中!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选!

评选报名截至2024年3月31日 7351f1560a0b69238c8fdcd9eda6e069.png

4ff892488b9315e6f1e54481669b7b37.png

中国AIGC产业峰会同步火热筹备中,了解更多请戳:Sora时代,我们该如何关注新应用?一切尽在中国AIGC产业峰会

商务合作请联络微信:18600164356 徐峰

活动合作请联络微信:18801103170 王琳玉

点这里👇关注我,记得标星噢

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值