LlaMA 2
LlaMA 2是Meta AI 发布的一系列最先进的开源大模型。您可以将其用于商业用途,并且它附带代码、预训练模型和微调模型。所有资源都可以在 HuggingFace 上找到,您甚至可以在HuggingChat上试用来体验模型性能。通过公开 Llama 2,Meta AI 使研究人员和开发人员能够构建由高级语言功能支持的创新应用程序。
Claude 2
Claude 2是 Anthropic 对话式人工智能助手的最新版本。它具有改进的性能、更长的响应时间,并且可以通过 API 以及面向公众的新测试版网站 claude.ai 进行访问。与之前的 Claude 版本相比,Anthropic 的开发人员专注于增强其在编码、数学和逻辑推理等领域的能力。例如,Claude2 最近在律师考试的多项选择部分得分为 76.5%,比 Claude 1.3 的 73.0% 显着提高。您可以在Poe上访问所有类型的Claude2模型并亲自体验。
PaLM 2
Google AI PaLM 2 是 Google 最新的大型语言模型,擅长高级推理任务,包括代码、数学、分类、问答、翻译、多语言能力和自然语言生成。由于其优化的计算扩展方法、增强的数据集混合和架构改进,它在所有这些功能上都优于以前最先进的大型语言模型(例如原始 PaLM)。您可以使用Bard免费访问它。
Vicuna 1.3
Vicuna-33b-v1.3是根据LLaMa进行微调,并对从ShareGPT收集的125K对话进行了监督指令微调。它是Open LLM 排行榜上表现最好的模型之一。您可以在 HuggingFace 上免费访问该模型,或尝试lmsys.org上的官方演示。
MPT-30B-Chat
MPT-30B-Chat是一个经过微调以生成对话的聊天机器人。它是通过在多个对话数据集(ShareGPT-Vicuna、Camel-AI、GPTeacher、Guanaco、Baize 和一些生成的数据集)上对 MPT 30B 进行微调而创建的。 MPT-30B-Chat 是 Open LLM 排行榜上的顶级型号之一,您可以在Saisml 的 Hugging Face Space上免费体验它。
结论
虽然 GPT-4 仍然封闭且无法访问,但令人兴奋的开源大型语言模型正在成为任何人都可以使用的替代方案。 Anthropic 的 Claude2、Meta 的 LLaMA2 和 MPT-30B 等模型在会话能力、推理和多语言多功能性方面显示出显着的进步。尽管规模不如 GPT-4,但这些免费模型表明最先进的语言人工智能继续快速发展。它们在数学、编码和逻辑等领域的优势使它们能够替代许多应用程序。
LlaMA2 模型推出后,出现了一批在各种数据集上进行微调的高性能模型。您可以在Open LLM 排行榜上查看所有这些内容。