大模型
文章平均质量分 83
是小杜吖.
这个作者很懒,什么都没留下…
展开
-
所有开源大语言模型完整列表(最全!!可部署,建议收藏)
Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。所谓"语言模型",就是只用来处理语言文字(或者符号体系)的 AI 模型,发现其中的规律,可以根据提示 (prompt),自动生成符合这些规律的内容。LLM 通常基于神经网络模型,使用大规模的语料库进行训练,比如使用互联网上的海量文本数据。原创 2024-08-05 13:44:32 · 1589 阅读 · 0 评论 -
使用免费算力对gemma进行微调(以gemma 2b的LORA微调为例)
Gemma是Google推出的一系列轻量级、最先进的开放模型,基于创建Gemini模型的相同研究和技术构建。提供了 2B 和 7B 两种不同规模的版本,每种都包含了预训练基础版本和经过指令优化的版本。所有版本均可在各类消费级硬件上运行,无需数据量化处理,拥有高达 8K tokens 的处理能力:它们是文本到文本的、仅解码器的大型语言模型,提供英语版本,具有开放的权重、预训练的变体和指令调优的变体。Gemma模型非常适合执行各种文本生成任务,包括问答、摘要和推理。原创 2024-04-06 11:14:33 · 625 阅读 · 1 评论 -
一分钱不花!手把手教你部署Google最强开源AI大模型Gemma教程
一分钱不花!本地部署Google最强开源AI大模型Gemma教程半个多月前,谷歌搞了一波突然袭击,毫无预兆地发布了新一代AI模型Gemma,并宣称这是全球性能最强大的轻量级开源系列模型。原创 2024-03-24 15:56:15 · 3291 阅读 · 5 评论