使用 Ollama 部署本地 LLM：构建AI REST API的简易指南

最新推荐文章于 2024-09-30 13:49:56 发布

大模型与自然语言处理

最新推荐文章于 2024-09-30 13:49:56 发布

阅读量997

点赞数 13

文章标签：人工智能深度学习大模型自然语言处理算法面试题

本文链接：https://blog.csdn.net/2201_75499313/article/details/142627579

版权

最近这一两周看到不少互联网公司都已经开始秋招提前批面试了。

不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC 在变少，岗位要求还更高了。

最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。

总结链接如下：

《大模型面试宝典》(2024版) 发布！

喜欢本文记得收藏、关注、点赞。

利用Ollama本地LLM（大语言模型）搭建AI的REST API服务是一个实用的方法。下面是一个简单的工作流程。

1. 安装Ollama和LLMs

首先，在本地机器上安装Ollama和本地LLMs。Ollama可以帮助你轻松地在本地部署LLMs，并让它们更方便地处理各种任务。

安装 Ollama

Ollama安装界面

Ollama下载页面

安装应用文件

为Ollama安装LLMs

ollama pull llama3
ollama run llama3

下载并运行llama3

在本地与llama3对话

Ollama命令

可用的命令：
  /set         设置会话变量
  /show        显示模型信息
  /bye         退出
  /?, /help    帮助命令

使用 "" 开始多行消息

测试Ollama

curl http://localhost:11434/api/generate -d '{  
  "model": "llama3",  
  "prompt": "为什么天空是蓝色的？",  
  "stream": true  
}'

在这里插入图片描述

如果stream设置为false，响应将是一个完整的JSON对象。

curl http://localhost:11434/api/generate -d '{  
  "model": "llama3",  
  "prompt": "为什么天空是蓝色的？",  
  "stream": false  
}'

2. 设置FastAPI

接下来，设置一个Python的FastAPI应用。FastAPI是一个现代、快速（高性能）的Web框架，基于标准的Python类型提示，支持Python 3.7及以上版本。它是构建稳健高效API的理想选择。

编写FastAPI的路由和端点，以便与Ollama服务器进行交互。这个过程包括发送请求给Ollama以处理任务，比如文本生成、语言理解或其他LLM支持的AI任务。以下是一个简单的代码示例（你也可以使用 Ollama Python库来优化代码）。

from typing import Union
from fastapi import FastAPI
from pydantic import BaseModel
import json
import requests

app = FastAPI(debug=True)

class Itemexample(BaseModel):
    name: str
    prompt: str
    instruction: str
    is_offer: Union[bool, None] = None

class Item(BaseModel):
    model: str
    prompt: str

urls = ["http://localhost:11434/api/generate"]

headers = {
    "Content-Type": "application/json"
}

@app.get("/")
def read_root():
    return {"Hello": "World"}

@app.post("/chat/{llms_name}")
def update_item(llms_name: str, item: Item):
    if llms_name == "llama3":
        url = urls[0]
        payload = {
            "model": "llama3",
            "prompt": "为什么天空是蓝色的？",
            "stream": False
        }
        response = requests.post(url, headers=headers, data=json.dumps(payload))
        if response.status_code == 200:
            return {"data": response.text, "llms_name": llms_name}
        else:
            print("错误:", response.status_code, response.text)
            return {"item_name": item.model, "error": response.status_code, "data": response.text}
    return {"item_name": item.model, "llms_name": llms_name}

测试REST-API服务

curl --location 'http://127.0.0.1:8000/chat/llama3' \
--header 'Content-Type: application/json' \
--data '{
  "model": "llama3",
  "prompt": "为什么天空是蓝色的？"
}'