Meta AI 同时在其官方发布了论文《LLaMA: Open and Efficient Foundation Language Models》
LLM-20230225:LLaMA(大羊驼)【参数量: 70 亿、130 亿、330 亿、650 亿】【旨在推动 LLM 领域的小型化、平民化研究】【Meta】
于 2023-03-09 14:48:23 首次发布
Meta AI 发布了LLaMA,一个包括70亿、130亿、330亿、650亿参数的开源语言模型,旨在推动LLM的小型化和平民化研究。LLaMA在某些测试中超越了GPT-3,且只需8GB显存即可运行。模型基于Transformer架构并采用RMSNorm、SwiGLU激活和RoPE改进。训练数据包括多种语言,主要来自网络内容。尽管存在偏见问题,LLaMA在多项任务上展现出优秀性能,且Meta计划发布更大规模的模型。
摘要由CSDN通过智能技术生成