无需GPU，一键搭建本地大语言模型(LLM)服务，提供 OpenAI 接口 | 附 C#/Python 代码

最新推荐文章于 2024-04-19 19:54:33 发布

寒冰屋

最新推荐文章于 2024-04-19 19:54:33 发布

阅读量1.1k

点赞数

分类专栏：人工智能 python CSharp.NET 文章标签： LLM c# python OpenAI

原文链接：https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654098659&idx=8&sn=b981126fc6b7a0a219b2fd5953c2bba0&chksm=80d870b6b7aff9a022e0f9962e81c7c70d0e8015daf9ce3c2969a3ca455b8390d257eed30ea1&mpshare=1&scene=23&srcid=01094jrIvghY9n8n8ShzdxLh&sharer_shareinf

版权

CSharp.NET 同时被 3 个专栏收录

981 篇文章 45 订阅

订阅专栏

人工智能

393 篇文章 52 订阅

订阅专栏

python

238 篇文章 8 订阅

订阅专栏

无论是由于网络访问限制，还是数据安全原因，我们可能需要私有化部署大语言模型（LLM），以便在本地运行访问。

本项目(https://github.com/feiyun0112/Local-LLM-Server)提供了一个快速搭建私有大语言模型服务器的方法，只需要一行命令，就可以在本地搭建一个私有的大语言模型服务器，并提供OpenAI兼容接口。

注意：本项目在CPU 环境下也可以使用，但是速度会较慢。

使用方法

1. 安装依赖

首先，确保你的机器安装了 Python（我使用的是3.10）
然后，安装依赖

pip install -r requirements.txt

2. 下载模型

本项目基于FastChat实现，FastChat支持多种大语言模型(https://github.com/lm-sys/FastChat/blob/main/docs/model_support.md)。

我个人只测试了 LLM 模型 https://huggingface.co/THUDM/chatglm3-6b 与 Embedding 模型 https://huggingface.co/BAAI/bge-large-zh，其他模型理论上也可以使用。

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b
git clone https://huggingface.co/BAAI/bge-large-zh

3. 配置

本项目可以同时部署多个模型，只需要在 config.py 中配置模型名称和路径键值对即可。

WORK_CONFIG = {
    "host": HOST,    
    "port": 21002,
    # 模型名称和路径键值对
    "models": {
        "ChatModel":"d:/chatglm3-6b", # 名称可以自定义，路径可以用相对路径或绝对路径
        "EmbeddingsModel":"c:/models/bge-large-zh", 
    },    
}

4. 启动服务

python startup.py

当看到如下输出时，说明服务已经启动成功：

Local-LLM-Server 启动成功，请使用 http://127.0.0.1:21000 访问 OpenAI 接口

使用示例

示例代码都存放在本项目 demos 目录下。

1. python

import openai

openai.api_key = "Empty"
openai.base_url = "http://localhost:21000/v1/"

# 使用 LLM 模型
completion = openai.chat.completions.create(
    model="ChatModel",
    messages=[{"role": "user", "content": "请自我介绍一下?"}]
)
print(completion.choices[0].message.content)


# 使用 Embeddings 模型
embedding = openai.embeddings.create(
    model="EmbeddingsModel",
    input = "欢迎关注我的个人公众号MyIO!", 
    encoding_format="float")
print(embedding.data[0].embedding)

2. C#

需引用 Nuget Semantic-Kernel 1.0.1

using Microsoft.SemanticKernel;

var kernel = Kernel.CreateBuilder()
        .AddOpenAIChatCompletion(
             modelId: "ChatModel",
             apiKey: "NoKey",
             httpClient: new HttpClient(new MyHandler())
        ).Build();

var prompt = "请自我介绍一下?";
var result = await kernel.InvokePromptAsync(prompt);
var answer = result.GetValue<string>();
Console.WriteLine(answer);

由于 Microsoft.SemanticKernel 没提供直接设置 OpenAI 服务器地址的方法，所以自定义一个 DelegatingHandler，将 OpenAI 服务器地址修改为 Local-LLM-Server 地址。

class MyHandler : DelegatingHandler
{
    public MyHandler()
        : base(new HttpClientHandler())
    {
    }
    protected override Task<HttpResponseMessage> SendAsync(HttpRequestMessage request, CancellationToken cancellationToken)
    {
        var newUriBuilder = new UriBuilder(request.RequestUri);
        newUriBuilder.Scheme = "http";
        newUriBuilder.Host = "127.0.0.1";
        newUriBuilder.Port = 21000;

        request.RequestUri = newUriBuilder.Uri;
        return base.SendAsync(request, cancellationToken);
    }
}

总结

如果你觉得这个项目对你有帮助，请帮忙点个小星星⭐️

https://github.com/feiyun0112/Local-LLM-Server

引入地址

寒冰屋

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
无需GPU，一键搭建本地大语言模型(LLM)服务，提供 OpenAI 接口 | 附 C#/Python 代码

无论是由于网络访问限制，还是数据安全原因，我们可能需要私有化部署大语言模型（LLM），以便在本地运行访问。本项目(https://github.com/feiyun0112/Local-LLM-Server)提供了一个快速搭建私有大语言模型服务器的方法，只需要一行命令，就可以在本地搭建一个私有的大语言模型服务器，并提供OpenAI兼容接口。
复制链接

扫一扫