白嫖最强开源AI LIama 3.1 llama-3.2-11b-vision多模态大模型

阿杰的人生路

于 2024-09-29 22:06:30 发布

阅读量323

点赞数 10

分类专栏：用AI工作学习创作文章标签：人工智能 llama

本文链接：https://blog.csdn.net/xiaokaqi/article/details/142644676

版权

用AI工作学习创作专栏收录该内容

5 篇文章 0 订阅

订阅专栏

注册方式在下方，封控较为频繁，比较费账号，如果你嫌注册麻烦，可以使用OminiAI 中转API服务，国内可直接调用。https://api.ominiai.cn 或者可单独购买 Groq API Key

Groq，一家初创于AI芯片领域的企业，最近扩展其业务范围，进入了AI大模型推理服务市场。本文将探讨Groq推出的一项革新性公益项目，该项目允许用户免费接入其强大的AI大模型推理服务，该服务现已包括Gemma、Llama、Mixtral等10种模型，并提供两种文字转语音（TTS）模型。
目前支持模型如下

Model
上下文
模型质量
延迟
模型介绍
使用场景
gemma2-9b-it
8k

71
0.25
拥有 90 亿参数，平衡性能与资源使用，适合多种中等复杂度的应用场景。
客服应用：高效响应且质量较高的客户支持系统。; 内容生成：生成中等长度的文本内容，如博客文章、产品描述等。
gemma-7b-it
8k
45
0.82
拥有 70 亿参数，具备高输出速度，适合需要快速处理的应用。
实时对话系统：快速响应的聊天机器人或即时通讯应用。; 轻量级内容生成：生成简短的文本内容，如短信回复、简短的说明文档等。
llama-3.1-70b-versatile
128k
95
0.41
拥有 700 亿参数，处理复杂任务，适用于高要求的内容生成和推理。
高级内容生成：生成长篇复杂内容，如报告、小说、技术文档等。; 复杂推理任务：需要深入理解和推理的应用，如法律文档分析、科学研究等。
llama3-70b-8192
8k
83
0.24
拥有 700 亿参数，支持长上下文，适合需要处理长文本的任务。
长文本处理：处理和生成长文本，如书籍摘要、长篇内容创作等。; 高级对话系统：理解和维护长对话上下文的智能助手或客户支持系统。
llama-3.1-8b-instant
128k
66
0.39
拥有 80 亿参数，提升性能与速度，适合需要高效率的应用。
高效内容生成：快速生成高质量内容，如新闻摘要、快速报告生成等。; 智能推荐系统：根据用户输入实时生成个性化推荐的应用，如电商推荐系统、内容推荐引擎等。
llama3-8b-8192
8k
64
0.33
拥有 80 亿参数，快速输出，适中质量，适合多种实时应用。
高效对话系统：快速响应和处理长对话上下文的聊天机器人。; 实时数据处理：高吞吐量和快速处理的实时数据应用，如实时翻译、实时摘要生成等。
mixtral-8x7b-32768
33k
61
0.24
拥有多个并行模型，超长上下文，适合大规模文本处理。
超长文本处理：处理和生成极长文本的应用，如全书分析、长篇论文生成等。; 复杂任务处理：同时处理多个任务或并行任务的系统，如多任务学习、复杂问题解决等。
llama3-groq-70b-8192-tool-use-preview
8k
83
0.24
拥有 700 亿参数，优化工具使用，适合高级工具集成应用。
工具集成应用：集成多种工具和服务的复杂系统，如智能助手、自动化工作流等。; 高级内容生成与编辑：需要高级编辑和生成能力的应用，如专业文档编辑、创意内容生成等。
llama3-groq-8b-8192-tool-use-preview
8k
64
0.33
拥有 80 亿参数，优化工具使用，高效集成，适合需要高效工具集成的应用。
高效工具集成：快速集成和使用多种工具的应用，如即时数据分析、实时工具操作等。; 实时决策支持：快速生成决策建议和支持的应用，如金融决策系统、实时监控系统等。
llama-guard-3-8b
8k
64
0.33
拥有 80 亿参数，专为安全性优化，适合需要额外安全保障的应用。
安全敏感应用：高度安全和隐私保护的系统，如医疗健康应用、金融服务等。; 内容审核与过滤：内容审核、垃圾信息过滤等需要高安全性的场景。
distil-whisper-large-v3-en
—
—
—
一个精简版的 Whisper 大型模型，专为英语语音识别和转录任务设计，兼具高准确性和高效率。
语音转文本：高效将英语语音内容转换为文本，如会议记录、字幕生成等。; 实时翻译：结合其他翻译工具，实现实时语音翻译功能。
whisper-large-v3
—
—
—
Whisper 大型模型，提供卓越的语音识别和转录能力，支持多语言和复杂音频环境下的准确转录。
多语言语音转文本：支持多种语言的语音转文本，适用于国际会议、跨语言交流等场景。; 语音分析：用于语音数据的深度分析，如情感分析、关键词提取等。
llava-v1.5-7b-4096-preview
4096
$0.006/次

支持多模态输入，拥有 70 亿参数，适合处理和生成多种类型输入，如图像和文本。
多模态应用：处理和生成多种类型输入的应用，如视觉问答系统、图像描述生成等。; 高级内容分析：同时分析和生成多模态内容的研究和开发项目。
llama-3.2-1b-preview
1k
$0.004/次

拥有 10 亿参数，适合低资源任务，能够处理文本生成和简单的自然语言处理任务。
轻量级应用：适用于需要高效处理文本任务的应用，如文本分类和简单对话生成。; 初学者模型：适合用于教学和快速原型开发的研究项目。
llama-3.2-11b-vision-preview
1k
$0.004/次

支持多模态输入，拥有 110 亿参数，特别适合图像和文本联合处理的任务。
多模态任务：适合需要同时处理视觉和文本的应用，如图像描述生成、视觉问答系统等。; 高级视觉分析：适合用于结合视觉和文本的研究项目。
llama-3.2-11b-text-preview
11k
$0.004/次

拥有 110 亿参数，专注于高级自然语言处理任务，如长文本生成和复杂的语言理解。
高级语言模型应用：适用于对话生成、文章写作、自然语言理解等。; 长文本生成：专门用于处理长文档生成和高复杂度语言任务。
llama-3.2-90b-text-preview
90k
$0.004/次

拥有 900 亿参数，适合处理极复杂的语言生成任务，提供高质量的文本输出。
高精度语言任务：适合用于要求极高语言理解和生成质量的应用，如学术写作、技术文档生成等。; 大规模自然语言处理：适合需要极高计算能力的复杂文本生成任务。
llama-3.2-3b-preview
3k
$0.004/次

拥有 30 亿参数，适合中等规模的自然语言处理任务，如对话生成和信息提取。
中等规模应用：适合对话系统、文本生成和实体识别等任务。; 平衡性能与效率：在保持性能的同时提供高效计算的自然语言处理模型。
Semantic Scholar S2 API
—
$0.03(¥0.2)/次

Semantic Scholar S2 API 是一个学术数据接口，能让用户方便地获取大量学术论文、引用和作者信息，帮助开发者和科研人员更轻松地构建与学术内容相关的工具和服务。
论文推荐系统：根据用户输入推荐相关领域的最新论文。引用分析工具：分析论文的引用影响力和引用链。研究趋势洞察：获取领域内的热门研究和最新趋势。自动化研究助理：自动汇总和推荐文献，减少手动查找时间。作者影响力分析：评估作者的学术影响力和合作关系。科研数据可视化：生成引用网络、影响力图等可视化工具。
Zotero 工具插件支持

支持最强开源AI LIama 3.1 LIama 3.2 llama-3.2-11b-text-preview llama-3.2-90b-text-preview
在150多个基准测试集中，LIama 3.1 405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。
[图片]
如何获取Groq服务？
1️⃣ 账户注册：

访问 https://console.groq.com/login 使用邮箱或通过Github、Google账号注册并登录Groq平台。
[图片]
2️⃣ API密钥生成：
在Groq控制台中选择API Keys菜单，点击“Create API Key”按钮，生成用于调用服务的密钥。
[图片]
3️⃣ 使用限制：
为防止资源滥用，Groq对服务的使用做了一些必要限制，如调用次数和Token使用量，但对大多数个人用户而言，这些限制已经足够宽松。
[图片]
4️⃣启动Groq服务
一旦获得API Key，即可在多个兼容Groq的大模型客户端中使用，例如Oneapi、Dify、NextChat及LobeChat等。下面是在LobeChat中配置Groq的步骤：
在LobeChat设置中选择“语言模型”，配置Groq选项。
如果是直接连接Groq，API代理地址留空；如果使用服务如Oneapi，则填写相应的代理地址。
将API Key填入指定位置，选择需要的模型。
设置完成后，用户可返回LobeChat的主界面，选择Groq的某一模型，例如高性能的Gemma2 9B模型，开始体验与AI的交流。
经过实际体验，Groq的服务响应迅速，即使在高频使用下也未触发任何限制，显示出其稳定性和高效性。Groq不仅提供了一个可靠的免费资源，还为那些寻求高性能AI模型服务的用户提供了一个极佳的选择，无疑成为值得依赖的备选模型库的一部分。
5️⃣代码调用
使用python 可以很方便调用和处理一些事情、例如我的资讯网站就是用groq api处理的可以参考下 ominiai.cn
关注、点赞、分享可以送一个APIKey

import os

from groq import Groq

client = Groq(
    api_key=os.environ.get("GROQ_API_KEY"),
)

chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "Explain the importance of fast language models",
        }
    ],
    model="llama3-8b-8192",
)

print(chat_completion.choices[0].message.content)```

目前OMINIAI 中转API 支持以下模型：【api.ominiai.cn】
"gemma2-9b-it","llama-3.1-8b-instant","gemma-7b-it","llava-v1.5-7b-4096-preview","distil-whisper-large-v3-en","whisper-large-v3","llama-3.2-1b-preview","mixtral-8x7b-32768","llama3-8b-8192","llama-3.2-11b-vision-preview","llama-3.2-3b-preview","llama-3.2-90b-text-preview","llama3-groq-70b-8192-tool-use-preview","llama-guard-3-8b","llama3-groq-8b-8192-tool-use-preview","llama-3.2-11b-text-preview","llama-3.1-70b-versatile","llama3-70b-8192",gpt-3.5-turbo,gpt-4,gpt-4-turbo,gpt-4o,gpt-4o-mini,gpt-3.5-turbo-16k,gpt-4-32k