AI周报丨DeepMind用2800亿参数的Gopher，测试语言系统极限；Julia还是Python？PyTorch选择谁？

最新推荐文章于 2024-07-16 22:33:49 发布

极链AI云

最新推荐文章于 2024-07-16 22:33:49 发布

阅读量1.2k

点赞数

分类专栏： AI周报文章标签：人工智能 python 深度学习 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60673947/article/details/121861723

版权

DeepMind通过2800亿参数的Gopher模型展示大规模语言模型的潜力，强调继续增大模型会有显著改进。另一方面，PyTorch核心开发者讨论了Python与Julia的权衡，表明PyTorch正借鉴Julia的特性，但不会完全转向Julia，以保持Python的生态系统优势。

摘要由CSDN通过智能技术生成

# 行业大事件

增大模型依然有用，DeepMind用2800亿参数的Gopher，测试语言系统极限

DeepMind 连发三篇论文，全面阐述大规模语言模型依然在进展之中，能力也在继续增强。

近年来，国内外各大 AI 巨头的大规模语言模型（large language model，LLM）一波接着一波，如 OpenAI 的 GPT-3、智源研究院的悟道 2.0 等。大模型已然成为社区势不可挡的发展趋势。

然而，当前语言模型存在着一些问题，比如逻辑推理较弱。那么，我们是否可以仅通过添加更多数据和算力的情况下改进这些问题呢？或者，我们已经达到了语言模型相关技术范式的极限？

今日，DeepMind「一口气」发表了三篇论文，目的之一就是解决当前语言模型存在的问题。DeepMind 得出的结论是进一步扩展大规模语言模型应该会带来大量的改进。此前在一次电话简报会上，DeepMind 研究科学家 Jack Rae 表示，「这些论文的一个关键发现是大规模语言模型依然在进展之中，能力也在继续增强。这个领域并没有停滞不前。」

博客地址：https://deepmind.com/blog/article/language-modelling-at-scale

这三篇论文的主题分别如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。