本地部署 text-generation-webui

engchina

已于 2023-12-27 22:54:37 修改

阅读量4.9k

点赞数 32

分类专栏： LINUX 文章标签： oobabooga GPTQ AWQ llama.cpp EXL2

于 2023-12-27 11:58:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/engchina/article/details/135241598

版权

本地部署 text-generation-webui

0. 背景
1. text-generation-webui 介绍
2. 克隆代码
3. 创建虚拟环境
4. 安装 pytorch
5. 安装 CUDA 运行时库
6. 安装依赖库
7. 启动 Web UI
8. 访问 Web UI
9. OpenAI 兼容 API

0. 背景

一直喜欢用 FastChat 本地部署大语言模型，今天试一试 text-generation-webui 这个项目。

在这里插入图片描述

1. text-generation-webui 介绍

text-generation-webui 适用于大型语言模型的 Gradio Web UI。支持transformers、GPTQ、AWQ、EXL2、llama.cpp (GGUF)、Llama 模型。

它的特点如下，

3种界面模式：default (two columns), notebook, chat
支持多个模型后端：Transformers、llama.cpp（通过 llama-cpp-python）、ExLlama、ExLlamaV2、AutoGPTQ、AutoAWQ、GPTQ-for-LLaMa、CTransformers、QuIP#。
下拉菜单可在不同模型之间快速切换。
大量扩展（内置和用户贡献），包括用于真实语音输出的 Coqui TTS、用于语音输入的 Whisper STT、翻译、多模式管道、向量数据库、Stable Diffusion集成等等。有关详细信息，请参阅 wiki 和

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。