一篇文章读懂大模型类型：LLM、TTS、Text-Embedding、Rerank

jane_xing

已于 2025-02-19 14:31:23 修改

阅读量2.5k

点赞数 16

分类专栏：人工智能文章标签：人工智能

于 2025-02-19 14:26:44 首次发布

本文链接：https://blog.csdn.net/jane_xing/article/details/145728588

版权

以下是 大模型类型 LLM、TTS、Text-Embedding、Rerank 的定义、核心理解及应用场景的详细说明，帮助你在实际项目中合理选择和应用。

1. LLM（Large Language Model，大语言模型）

定义：

LLM 是一种基于海量文本训练的大型神经网络模型，能够理解和生成自然语言文本，完成对话、问答、写作等任务。
典型模型：GPT-4、Llama、PaLM、Claude。

核心理解：

输入输出：接收文本输入（Prompt），生成文本输出。
能力范围：文本生成、逻辑推理、代码编写、多语言支持等。
局限性：知识依赖训练数据，可能存在幻觉（生成错误内容）。

应用场景：

对话系统：ChatGPT 类聊天机器人。
内容生成：文章写作、营销文案、代码补全。
知识问答：基于文档的问答（结合 RAG 技术）。
工具调用：通过 Function Calling 连接外部 API（如查询天气）。

示例：

# 调用 LLM 生成文本（以 OpenAI 为例）
response = openai.chat.completions.create(
    model="gpt-4",
    messages=[{
   "role": "user", "content": "用100字解释量子计算"}]
)
print(response.choices[0]

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jane_xing

关注关注

16
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

LLM-TTS 大模型对话语音实时回复

weixin_42357472的博客

02-26

1396

1）推理用的vllm，参考https://blog.csdn.net/weixin_42357472/article/details/136165481。3）tts生成 edge_tts包，微软的需要联网。2）用的openai api LLM对话接口。4）电脑播放语音 playsound包。

AI 核心技术教程：LLM、Text Embedding、Speech2Text、Moderation、TTS

宋发元

03-20

833

LLM（Large Language Model，大语言模型）是一种深度学习模型，基于 Transformer 结构，能够理解和生成自然语言文本。ASR（Automatic Speech Recognition）是将语音信号转换为可读文本的技术。随着人工智能的快速发展，NLP（自然语言处理）、语音识别、内容审核等技术正在重塑各个行业。Text Embedding 是将文本转换为高维向量，以便计算机进行语义理解。TTS（Text-to-Speech）用于将文本转换为语音，常见模型有。以帮助初学者快速上手。

参与评论您还未登录，请先登录后发表或查看评论

embedding和rerank模型对比

AI大模型/Python/Java/MySQL技术栈，快来和我一起学习吧 ~

04-01

868

【代码】embedding和rerank模型对比。

RAG检索全攻略：Embedding与Rerank模型的终极指南

xx_nm98的博客

03-22

1448

Embedding Model的核心任务是将文本、图像或其他数据类型转化为密集向量（Dense Vector），这种向量形式便于快速检索和相似度计算。RAG系统中，Embedding Model主要用于构建知识库并实现高效召回。Embedding Model的原理（结合RAG）在RAG系统中，Embedding Model的工作原理可以归纳为以下步骤：文本编码：将文本片段转换为向量（Embedding），该向量捕获了文本的语义信息。

语音合成TTS主要模型分析

技术札记

03-13

6300

语音合成TTS发展过程中模型对比分析

大模型开发实战篇6：文字配音模型 Text-To-Speech(TTS)

沐雪架构师

02-17

1289

Text-To-Speech（TTS）文字配音模型是一种用于将文本信息转换成自然语音的技术。OpenAI的文字配音 API 提供了一个基于 TTS（文本到语音）模型的服务。alloyashcoralechofableonyxnovasageshimmer默认响应格式是 "mp3"，但也支持其他格式，如 "opus"、"aac"、"flac" 和 "pcm"。TTS 模型在语言支持方面通常遵循 Whisper 模型。

TTS（Text-to-Speech）和LLM（Large Language Model）介绍

nbspzs的专栏

10-28

868

LLM 是一种使用深度学习训练的大型语言模型，能够生成、理解和处理人类语言，通常用于对话、文本生成、语言翻译、问答等复杂的语言任务。TTS 是一种将文本转化为语音的技术，主要用于将书面文字转换成自然、流畅的语音，模拟人类的声音输出。LLM：一种大型的自然语言生成与理解模型，用于回答问题、对话、生成内容等文本处理任务。主要功能：专注于“理解和生成”语言，支持对话、信息检索、总结和推理等任务。主要功能：专注于“文本到语音”转换，模拟发音、语调、情感等。应用场景：聊天机器人、内容创作、编程助手、翻译、文本分析。

全网最全的TTS模型汇总，电商人、自媒体人狂喜

specssss的博客

07-03

1075

以上就是小编给大家整理汇总的主流的TTS模型以及对应传送门，如果大家有云部署的需求，可以点击下方链接，查看GPU特惠活动：https://www.ucloud.cn/site/active/gpu.html？支持多种语言包括英语、中文，能够进行同语言生成和跨语言生成，能处理各种文本，叙述性文本、情感表达、描述性文本等，能根据不同的情感和语境生成相应的语音。原生支持英语、西班牙语、法语、中文、日语和韩语，具有灵活的语音风格控制和零样本跨语言语音克隆能力。可以控制音调、速度、性别、噪音水平、情绪特征等等。

LLM（大语言模型）、Chat 大模型和 Embedding 大模型

CSBLOG的博客

02-26

1958

LLM 是一种大规模的语言生成模型，通常基于 Transformer 架构，经过大量文本数据的训练，能够理解自然语言并生成高质量的文本。

亚马逊：LLM内化Text-to-SQL的数据库知识

大模型任我行的博客

10-04

1342

处理大规模数据库时，传统文本到SQL系统存在计算效率低下、信息遗漏以及依赖于额外的值检索步骤等问题。论文提出了一个名为YORO的新型文本到SQL范式，在训练阶段将数据库知识内化到模型参数中，在推理阶段无需访问数据库内容，显著缩短了文本到SQL任务的输入长度并提高了计算效率和准确性。

【大模型】使用 Xinference 部署本地模型，从GPU服务器到本地知识库搭建Dify【LLM大语言模型（glm-4-9b-chat）、Rerank 模型、Embedding（向量）模型】

起而行动，方能平定心中的惶恐

09-04

1万+

本文会用到博主写的一些线上脚本，如果搭建者时纯内网的话，可能需要手动压缩镜像，然后解压镜像，才能正常部署本文从GPU服务器获取、到 nvidia-docker的安装、再到Xinference 部署私有化三个模型，最后搭建dify（供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力，轻松构建和运营生成式 AI 原生应用）、最后再配置实例dify，配置dify实例，整合三个模型，最后实现知识库搭建。

[从0开始AIGC][LLM]：LLM中Encoder-Only or Decoder-Only？为什么主流LLM是Decoder-Only？

Bin_Dut的博客

08-26

2654

LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only？

【人工智能】Rerank模型与Embedding模型：差异解析与实战指南

田豆芽的IT技术专栏

04-19

462

在实际工程落地中，Embedding模型相当于雷达系统实现目标搜索，Rerank模型则是高精度制导系统。二者的黄金组合既能保证大规模检索效率，又能实现精准结果输出。# 延迟敏感型系统配置建议rerank_top_k = 3 # 减少精排数量else:rerank_top_k = 10 # 保障结果质量未来随着MoE架构的普及，我们将看到更多Embedding-Rerank联合训练的一体化模型出现。期待与大家在AI工程化的道路上共同探索！

AI大模型的TTS评测

酌沧

06-19

1868

L-MTL（Large Multi-Task Learning）Models 是一种大规模多任务学习模型，通过结合 Mixture of Experts（MMoE）框架与 Transformer 模型，实现对 TTS（Text-to-Speech）系统中多个评估指标的全面平衡评价。

Embedding和Rerank模型介绍

h1773655323的博客

04-25

6151

在信息检索和NLP处理中，embedding和rerank模型是两种常见的技术，它们通常用于提高搜索引擎、推荐系统和其他相关应用的性能和准确性。

有Embedding模型不够，还需要Rerank模型？