LLM-API 项目使用教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00828/article/details/142190656

LLM-API 项目使用教程

llm-api Fully typed & consistent chat APIs for OpenAI, Anthropic, Azure's chat models for browser, edge, and node environments. 项目地址: https://gitcode.com/gh_mirrors/llm/llm-api

1. 项目介绍

LLM-API 是一个开源项目，旨在提供一个统一的 API，使用户能够轻松地在不同的消费硬件配置上运行各种大型语言模型（LLMs）。无论您是希望在 Docker 容器中运行这些强大的模型，还是直接在本地机器上运行，LLM-API 都能满足您的需求。通过简单的 YAML 配置文件，LLM-API 可以自动下载您选择的模型并无缝执行，使其通过一个统一的、直观的 API 访问。

2. 项目快速启动

2.1 环境准备

在开始之前，请确保您已经安装了 Docker 引擎。以下是快速启动的步骤：

2.2 创建配置文件

首先，创建一个 config.yaml 文件，配置如下（使用示例中的配置）：

models_dir: /models # 容器内的目录
model_family: llama # 也可以是 `gptq_llama` 或 `huggingface`
setup_params:
  key: value
model_params:
  key: value

2.3 使用 Docker 运行 LLM-API

在终端中执行以下命令：

docker run -v $PWD/models/:/models:rw -v $PWD/config.yaml:/llm-api/config.yaml:ro -p 8000:8000 --ulimit memlock=16000000000 1b5d/llm-api

或者使用提供的 docker-compose.yaml 文件：

docker compose up

2.4 访问 API

启动后，模型将通过端口 8000 访问。您可以使用以下命令生成文本：

curl --location 'localhost:8000/generate' \
--header 'Content-Type: application/json' \
--data '[
  "prompt": "What is the capital of France?",
  "params": [
    // 其他参数
  ]
]'