AI大战，Meta发布大型语言模型LLaMA

最新推荐文章于 2024-08-16 17:43:08 发布

海森大数据

最新推荐文章于 2024-08-16 17:43:08 发布

阅读量257

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haisendashuju/article/details/129680368

版权

ChatGPT引爆了AI行业，全球的科技巨头都先后加入这场AI大战，作为行业大佬的Meta也不例外，宣布推出大型语言模型LLaMA，加入到了这场由微软、谷歌等科技巨头主导的AI“厮杀”中。

LLaMA 模型由 Meta 的FAIR 团队开发，旨在帮助研究人员和工程师探索人工智能应用和相关功能，在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面“有很大的前景”。

该公司将提供底层代码供用户使用，因此用户可以自行调整模型，并将其用于与研究相关的用例。LLaMA 模型接受了20种语言训练，包括拉丁语和西里尔字母语言，所需的计算能力远低于之前推出的大模型。

另根据Meta官网发布的论文，LLaMA目前包含70亿、130亿、330亿和650亿这4种参数规模的模型。其中，参数规模最小的LLaMA 7B也经过了超1万亿个tokens的训练。Meta表示，在大多数基准测试中，参数仅为十分之一的LLaMA-13B的性能优于OpenAI推出的GPT3(175B)，也即支持ChatGPT的GPT3.5的前身。LLaMA-65B也可与业内领先的Chinchilla-70B和PaLM-540B竞争。

同ChatGPT、New Bing不同，LLaMA并不是一个任何人都可以与之对话的产品，也并未接入任何Meta应用。更为确切地说，该产品将是一个开源的“研究工具”。

公司CEO扎克伯格在社交媒体上表示，LLaMA旨在帮助研究人员推进研究工作，LLM（大型语言模型）在文本生成、问题回答、书面材料总结，以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。

海森大数据

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

海森大数据 CSDN认证博客专家 CSDN认证企业博客

码龄3年

294: 原创

10万+: 周排名

1万+: 总排名

26万+: 访问

: 等级

3303: 积分

207: 粉丝

207: 获赞

14: 评论

329: 收藏

私信

关注

热门文章

最新评论

AI引领科学革命：AlphaFold开发者获2024诺贝尔化学奖
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
脑机接口（BCI）助力失语者重获交流能力：纽约大学最新研究突破
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
清华大模型XAgent登GitHub热榜！复杂任务轻松搞定
jackyjia844: 这个可以尝试使用吗？大神有方法吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。