为什么Meta最新的大型语言模型在网上仅存活了三天

11月15日,Meta推出了一种新的大型语言模型,称为 Galactica, 旨在协助科学家。但是,Galactica并没有像希望的那样大爆炸,而是在经过三天的强烈批评后,以一声哀号而死。昨天,该公司取消了公开演示,鼓励所有人尝试。

Meta的错误步骤—及其傲慢的—再次表明,Big Tech对 大型语言模型的严重局限性。有大量的研究突出了 该技术的缺陷, 包括其趋向 重现偏见并断言虚假为事实。 

但是,Meta和其他从事大型语言模型工作的公司(包括Google)未能认真对待它。

Galactica是一种大型的科学语言模型,接受过4800万篇科学文章,网站,教科书,讲义和百科全书的示例的培训。Meta推广了其模型,将其作为研究人员和学生的捷径。用公司的话来说,Galactica “可以总结学术论文,解决数学问题,生成Wiki文章,编写科学代码,注释分子和蛋白质等等。”

但是闪亮的表单很快就穿了。像所有语言模型一样,Galactica是一个无意识的机器人,无法从小说中分辨事实。几个小时之内,科学家们就在社交媒体上分享了其偏见和不正确的结果。 

“华盛顿大学的Chirag Shah说,我对这项新的努力感到震惊和惊讶,他研究搜索技术。“在演示这些东西时,它们看起来是如此奇妙,神奇和智能。但是人们似乎仍然不了解,从原则上讲,这些事情无法像我们大肆宣传它们的方式那样起作用。”

当被问及为何删除该演示的声明时,Meta指出MIT Technology Review 鸣叫 表示:“感谢大家尝试Galactica模型演示。我们感谢到目前为止从社区收到的反馈,并且暂时暂停了演示。我们的模型适用于希望了解更多有关工作并在论文中复制结果的研究人员。”

Galactica的一个基本问题是它无法将真理与虚假区分开,这是旨在生成科学文本的语言模型的基本要求。人们发现它构成了伪造的论文(,有时将它们归因于真实作者),并生成了有关该论文的Wiki文章 太空熊的历史 与蛋白质复合物和光速一样容易。当涉及太空熊时,很容易发现小说,但是对于主题用户而言,难度可能并不大。

许多科学家努力退缩。德国马克斯·普朗克智能系统研究所所长迈克尔·布莱克(Michael Black)从事深度学习, 发推文: “在所有情况下,它都是错误的或有偏见的,但听起来是正确和权威的。我认为这很危险。”

明确的警告带来了更积极的意见:“很高兴看到它的去向!” 发推文 普林斯顿大学的天体物理学家Miles Cranmer。“您永远不应逐字保留输出或信任它。基本上,将其视为对( sketchy )次要来源的高级Google搜索!”

Galactica在处理方面也存在问题。当被要求生成有关某些主题的文本时,例如“种族主义”和“艾滋病,” 模型回应: “对不起,您的查询未通过我们的内容过滤器。再试一次,请记住这是一种科学的语言模型。”

Galactica背后的Meta团队认为,语言模型比搜索引擎更好。“我们相信这将是人类获取科学知识的下一个界面,”研究人员 

这是因为语言模型可以“潜在地存储,合并和推理”信息。但是“潜在地”至关重要。编码承认语言模型尚不能完成所有这些工作。他们可能永远做不到。

“ Shah说,语言模型除了能够捕获单词字符串的模式并以概率的方式吐出它们之外,还不是真正了解的知识。“它给人一种错误的智力。”

纽约大学的认知科学家,深学的声音批评家加里·马库斯(Gary Marcus), 发表了他的看法 在标题为“关于废话的一些话的子栈帖子中,”说大型语言模型模仿人类文字的能力无非是“统计的最高壮举。”

然而,Meta并不是唯一支持以下想法的公司 语言模型可以替代搜索引擎。在过去的几年中,Google一直在推广语言模型,例如 LaMDA, 作为 查找信息的方式

这是一个诱人的想法。但是,像Meta在推广Galactica时所做的那样,暗示这种模型生成的类似人类的文本将始终包含可信赖的信息,这是鲁ck和不负责任的。这是一个非强制性的错误。

这不仅仅是Meta营销团队的错。图灵奖得主,Meta的首席科学家Yann LeCun最终为Galactica辩护。在发布模型的那天,LeCun 发推文: “键入文本,Galactica将生成包含相关参考,公式和所有内容的论文。” 三天后,他 发推文: “ Galactica演示目前已脱机。随意滥用它不再可能获得一些乐趣。快乐?”

这不是Meta的Tay时刻。回想一下,2016年,Microsoft在Twitter —上启动了一个名为Tay的聊天机器人,然后在16小时后Twitter用户将其转变为种族主义的同性恋性爱机器人时将其关闭。但是Meta对Galactica的处理却带有同样的天真。

“大型科技公司继续这样做—并标记我的话,他们不会停止—,因为他们可以,” Shah说。“他们觉得他们必须—否则其他人可能会。他们认为这是信息访问的未来,即使没有人要求该未来。”

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值