私有化文本嵌入（Embedding） + Weaviate

林森见鹿

于 2024-08-21 14:16:23 发布

阅读量304

点赞数 3

文章标签： embedding

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qianyuanruqu/article/details/141197665

版权

weavaite向量库可以集成第三方托管的模型，这使得开发体验得到了增强，例如

1、将对象直接导入Weaviate，无需手动指定嵌入(Embedding)

2、使用生成式AI模型(LLM)构建集成检索增强生成（RAG）管道

同时weaviate也可以与Transformers库无缝集成，允许用户直接在Weaviate数据库中利用兼容的模型。这些集成使开发人员能够轻松构建复杂的人工智能驱动应用程序

本文重点讨论通过本地模型文件（词嵌入模型gte-large-zh）来构建自定义Transformers模型镜像，通过与weaviate模块集成赋予weaviate文本嵌入功能。

构建自定义Transformers模型镜像

创建 Dockerfile 并下载模型

# 用于构建词嵌入模型镜像的基础镜像
FROM semitechnologies/transformers-inference:custom 
# 将本地词嵌入模型放到当前目录下（my-model） /app/models/model是词嵌入镜像生成后的位置
# 不要修改/app/model/model，因为这是weaviate应用程序指定的模型路径
COPY ./my-model /app/models/model

构建并标记 Dockerfile

docker build -f my-inference-image.Dockerfile -t my-inference-image .

在 Weaviate 实例中使用该镜像

配置docker-compose.yml文件

version: '3.4'
services:
weaviate:
command:
- --host
- 0.0.0.0
- --port
- '8080'
- --scheme
- http
image: cr.weaviate.io/semitechnologies/weaviate:1.24.8
ports:
- 8087:8080
- 50052:50051
t2v-transformers:
image: gte-large-zh
ports:
- "9090:8080"
environment:
ENABLE_CUDA: '1'
NVIDIA_VISIBLE_DEVICES: 'all'

# nvidia GPU支持配置
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
capabilities: [gpu]

设置ENABLE_CUDA= '1'，表示启用GPU，如果要启用GPU需要提供对gpu支持的容器。

前提条件
Installing the NVIDIA Container Toolkit — NVIDIA Container Toolkit 1.16.0 documentation

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
私有化文本嵌入（Embedding） + Weaviate

本文重点讨论通过本地模型文件（词嵌入模型gte-large-zh）来构建自定义Transformers模型镜像，通过与weaviate模块集成赋予weaviate文本嵌入功能。同时weaviate也可以与Transformers库无缝集成，允许用户直接在Weaviate数据库中利用兼容的模型。设置ENABLE_CUDA= '1'，表示启用GPU，如果要启用GPU需要提供对gpu支持的容器。weavaite向量库可以集成第三方托管的模型，这使得开发体验得到了增强，例如。# nvidia GPU支持配置。
复制链接

扫一扫

博客等级

码龄8年

27
原创

50
点赞

48
收藏

36
粉丝

关注

私信

热门文章

分类专栏

langserve 1篇
api handle 1篇
数据库
mysql 1篇
知数堂 1篇

最新评论

ollama在Linux中部署大模型步骤
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
无法绑定由多个部分组成的标识符
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。
无法绑定由多个部分组成的标识符
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加条理清晰的目录。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。