docker部署本地词向量模型

凯尔哥

已于 2024-07-29 17:22:15 修改

阅读量387

点赞数 9

分类专栏：大模型文章标签： langchain 语言模型深度学习人工智能

于 2024-07-29 17:21:04 首次发布

本文链接：https://blog.csdn.net/weixin_43507865/article/details/140776161

版权

大模型专栏收录该内容

2 篇文章 0 订阅

订阅专栏

开源项目：GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models

1. 下载词向量模型

参考我的另一篇博客：langchain 加载本地词向量模型

2. 部署词向量模型

就三行命令

model=/data/BAAI/bge-m3
volume=/home/project/text_embedding/models
docker run -p 8082:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.5 --model-id $model

会先去下载 docker 镜像，然后运行容器。我这里下载的是 cpu 版本的 docker 镜像，其他硬件环境的 docker 镜像参考：https://huggingface.co/docs/text-embeddings-inference/supported_models

特别要强调的是：model 的路径可不是随便写的。在我的这个例子中，启动 docker 时，映射的路径是$volume:/data，因此 model 的路径必须以/data 开头，不然的话是找不到模型的。

我的模型存放路径：/home/project/text_embedding/models/BAAI/bge-m3，大家可以参考我的路径来调整 model 和 volume 变量的值。

3. 调用词向量模型

使用 REST API 调用，可调用的 API 参考：Text Embeddings Inference API

curl 127.0.0.1:8082/embed \
    -X POST \
    -d '{"inputs":"What is Deep Learning?"}' \
    -H 'Content-Type: application/json'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

凯尔哥

关注关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

在Linux服务器上部署BERT预训练模型——展示了如何在Linux服务器上使用Docker容器部署BERT预

程序员光剑

08-07

1865

自然语言处理（NLP）技术一直以来都是非常热门的研究领域。深度学习（DL）也逐渐成为NLP的重要组成部分，并且BERT预训练模型已经成为事实上的标准模型。因此，了解BERT预训练模型及其部署至生产环境是一个必不可少的技能。本文将以BERT预训练模型的部署方式来介绍如何在Linux服务器上使用Docker容器部署BERT预训练模型。

docker安装向量数据库milvus

蔡定努

05-11

466

向量数据库是一种特殊的数据库，它以多维向量的形式保存信息。根据数据的复杂性和细节，每个向量的维数变化很大，从几个到几千个不等。这些数据可能包括文本、图像、音频和视频，使用各种过程(如机器学习模型、词嵌入或特征提取技术)将其转换为向量。矢量数据库的主要优点是它能够根据数据的矢量接近度或相似性快速准确地定位和检索数据。这允许基于语义或上下文相关性的搜索，而不是像传统数据库那样仅仅依赖于精确匹配或设置标准。推荐系统：向量数据库可以用于存储用户和物品的特征向量，以便实现个性化推荐。

参与评论您还未登录，请先登录后发表或查看评论

gitblog_00047的博客

05-13

1168

GraphRAG：LLM之本地部署GraphRAG（GLM-4+Xinference的embedding模型）（附带ollma部署方式）

weixin_44598554的博客

07-31

1700

有空再写微软开源的GraphRAG默认是使用openai的接口的（GPT的接口那是要money的），于是就研究了如何使用开源模型本地部署。

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

热门推荐

AAI666666的博客

04-08

1万+

只需三步，本地打造自己的AI个人专属知识库

Embedding模型部署及效果评测

python123456_的博客

06-13

3349

本文选用常见的几类中文友好的开源Embedding模型进行了简单效果评测，发现bge-m3和tao-8k的效果不错。有条件的读者可以将其部署在GPU上进行评测，应该会更快。另外，也可以使用更为全面的数据集进行评估，以得出更为权威的结论。在实际的生产环境中，还要进行压力测试，以评估文档向量化的性能。

如何在本地正确部署Dify服务

Python进阶专栏《爬虫实战进阶》，《数据分析入门与实战》原创作者

08-06

587

本文是该专栏的第49篇，后面会持续分享python的各种干货知识。Dify是一个开源的LLM（大型语言模型）应用开发平台，旨在为开发者提供从Agent构建到AI workflow编排、RAG检索、模型管理等全方位的能力，从而轻松构建和运营生成式AI原生应用。在本文中，笔者将针对Dify的核心知识点以及“本地如何部署Dify”，进行详细说明。具体细节部分，笔者在正文将结合实际完整图文案例进行详细说明，一文让你轻松学会在本地部署Dify。废话不多说，下面跟着笔者直接往下看正文详细内容。（附完整操作以及本地部署D

新技术前沿-2024-大型语言模型LLM的本地化部署

qq_20466211的博客

04-23

1299

大语言模型的本地化部署

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[1]-最新版快速实践并部署（检索增强生成RAG大模型）

丨汀、的博客

06-13

1608

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[1]-最新版快速实践并部署（检索增强生成RAG大模型）

【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型

04-22

302

【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。【大模型应用开发-实战】（三）使用embedding在⾃⼰的电脑上运⾏⼤模型。

【大模型应用开发-实战】（四）使用embedding在⾃⼰的电脑上运⾏⼤模型

04-22

288

使用大模型检索增强 Rerank 模型，检索效果提升太明显了！

2201_75499313的博客

01-28

4888

RAG 是一种结合了信息检索和文本生成的语言模型技术。简单来说，当你向大语言模型（LLM）提出一个问题时，RAG 首先会在一个大型的文档集合中寻找相关信息，然后再基于这些信息生成回答。Rerank 的工作就像是一个智能的筛选器，当 RAG 从文档集合中检索到多个文档时，这些文档可能与你的问题相关度各不相同。有些文档可能非常贴切，而有些则可能只是稍微相关或者甚至是不相关的。这时，Rerank 的任务就是评估这些文档的相关性，然后对它们进行重新排序。它会把那些最有可能提供准确、相关回答的文档排在前面。

文本嵌入推理：Hugging Face 的高效部署方案

gitblog_01113的博客

08-10

452

文本嵌入推理：Hugging Face 的高效部署方案 text-embeddings-inferenceA blazing fast inference solution for text embeddings models项目地址:https://gitcode.com/gh_mirrors/te/text-embeddings-inference 项目介绍文本嵌入推理（Text Embe...

基于LangChain+ChatGLM2-6B+embedding构建行业知识库

TURING.DT

11-13

2238

目的：最近在探索大模型本地化部署+知识库实现行业解决方案，安装过程记录，分享给需要的同学，安装前确定好各组件的版本非常重要，避免重复安装走老路。方案一：使用开源LLM本地部署和微调优点：数据最安全，因为不管是模型还是训练数据都在本地缺点：要调教出一个足够出色的模型，需要耗费较多的人力物力（当然相比于预训练已经好太多了）具体实施：（LLAMA、ChatGLM2）+（Lora、P-Tuningv2、promote-tunning等）方案二：基于LLM+向量数据库。

fastGpt中索引模型M3E换为bge-m3，处理效率翻8倍

yncjxnc的博客

04-26

2236

6、登陆one-api: http://127.0.0.1:18087，把旧的M3E地址http://127.0.0.1:6008修改为bgem3地址http://127.0.0.1:5000。1、在服务器100.161.35.42新建目录/data/wenda/model/bgem3。3、附件中的文件bge-m3.py放到/data/wenda/model/bgem3目录。，只要安装这一个依赖就行，因为前面已经安装好了fastgpt、docker等环境。2、在魔搭社区下载 git clone。

text-generation-inference使用

qq_44370676的博客

12-30

3987

text-generation-inference库使用

docker部署本地私有仓库

03-28

Docker是一种流行的容器化技术，可以将应用程序及其依赖项打包成一个独立的容器，方便在不同环境中进行部署和运行。而本地私有仓库则是用于存储和管理这些Docker镜像的地方。下面是关于如何在本地部署私有仓库的步骤： 1. 安装Docker：首先需要在你的机器上安装Docker。你可以根据操作系统的不同，选择合适的安装方式。 2. 创建私有仓库容器：使用以下命令创建一个本地私有仓库容器： ``` docker run -d -p 5000:5000 --restart=always --name registry registry:2 ``` 这个命令会在本地启动一个名为registry的容器，并将其映射到主机的5000端口。 3. 配置Docker客户端：默认情况下，Docker客户端只能从公共仓库中拉取镜像。为了能够使用本地私有仓库，需要进行一些配置。在Docker客户端的配置文件（通常是`/etc/docker/daemon.json`）中添加以下内容： ``` { "insecure-registries": ["localhost:5000"] } ``` 这样就允许Docker客户端从本地私有仓库拉取镜像了。 4. 推送和拉取镜像：现在你可以使用`docker push`命令将本地构建的镜像推送到私有仓库中，例如： ``` docker build -t myimage:tag . docker tag myimage:tag localhost:5000/myimage:tag docker push localhost:5000/myimage:tag ``` 同样，你也可以使用`docker pull`命令从私有仓库中拉取镜像： ``` docker pull localhost:5000/myimage:tag ``` 5. 验证私有仓库：你可以通过访问`http://localhost:5000/v2/_catalog`来验证私有仓库是否正常工作。如果返回一个空的JSON对象`{}`，表示私有仓库是空的。希望以上步骤对你有所帮助！