使用 SentenceTransformer 加载预训练模型

背太阳的牧羊人

于 2025-03-24 15:32:09 发布

阅读量621

点赞数 13

分类专栏：模型微调文章标签： python 模型加载 SentenTransfo

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013565133/article/details/146477589

版权

模型微调专栏收录该内容

51 篇文章

订阅专栏

使用 SentenceTransformer 加载预训练模型，简单来说就是通过 SentenceTransformer 这个库加载一个已经经过大量数据训练、学会了捕捉文本语义特征的模型，从而让你无需从零开始训练，就可以直接用它来生成句子或文本的向量表示。

预训练模型的概念
- 预训练模型：在大规模文本语料上提前训练好的模型。这些模型通过学习大量数据中的语言规律，能够捕捉文本的语义信息。
- 作用：使用预训练模型可以直接用于下游任务，比如文本相似度计算、语义检索、聚类等，而无需花费大量时间和资源重新训练。
SentenceTransformer 的作用
- SentenceTransformer 是一个专门用于生成句子或文本嵌入（即将文本转换为向量）的 Python 库。
- 加载预训练模型：当你调用 SentenceTransformer(model_id, ...) 时，库会自动下载并加载指定模型的网络结构和预训练权重。
- 举例：
```
from sentence_transformers import SentenceTransformer

# 加载预训练模型（例如 "all-MiniLM-L6-v2"）
model = SentenceTransformer("all-MiniLM-L6-v2")
```
  上面的代码会做如下几件事：
  - 检查本地是否已经缓存了名为 “all-MiniLM-L6-v2” 的模型。
  - 如果没有，则从在线仓库（如 Hugging Face）下载该模型。
  - 加载模型结构和预训练的参数，使模型能够生成高质量的文本嵌入。
加载后的模型如何使用
- 加载完成后，你可以直接调用模型的 encode() 方法，将输入的文本转换为一个向量（通常是 NumPy 数组）。
- 举例：
```
sentence = "今天天气真好！"
embedding = model.encode(sentence)
print(embedding.shape)  # 例如输出 (384,) 表示生成了一个384维的向量
```
  这里：
  - "今天天气真好！" 作为输入文本，被转换成一个数值向量，这个向量的每个数值代表了文本在语义空间中的某个维度。
  - 这些向量可以用于后续的相似度计算、聚类等任务。
为什么要使用预训练模型
- 节省时间和资源：从零开始训练一个能够捕捉语言特征的模型需要大量的数据和计算资源，而预训练模型已经完成了这部分工作。
- 性能优势：预训练模型经过大规模语料的训练，在许多任务上表现优异，具有较好的泛化能力。
- 易用性：只需要指定模型的标识符，就能快速加载和应用模型，无需关心底层的细节。

总的来说，使用 SentenceTransformer 加载预训练模型 就是利用现成的、经过充分训练的模型，把文本转换为可以进行数值计算的向量，从而帮助你解决各种自然语言处理任务，比如文本分类、信息检索和问答系统等。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。