【AI基础】大模型部署工具之ollama的安装部署以及api调用

旭日跑马踏云飞

已于 2024-07-01 12:21:13 修改

阅读量4.4w

点赞数 79

分类专栏： AI 文章标签： ai 人工智能 llama

于 2024-06-17 16:17:59 首次发布

本文链接：https://blog.csdn.net/tirestay/article/details/139744309

版权

ollama是大模型部署方案，对应docker，本质也是基于docker的容器化技术。

从前面的文章可以看到，部署大模型做的准备工作是比较繁琐的，包括各个环节的版本对应。ollama提供了一个很好的解决方案。

ollama主要针对主流的LLaMA架构的开源大模型设计，并且已被LangChain、Taskweaver等在内的多个热门项目高度集成。同时ollama提供了openAI兼容的api，可以最大限度的减少理解和开发成本。

一、下载安装ollama

1.1 安装

官方地址：https://ollama.com/

开源地址：https://github.com/ollama/ollama

下载后双击安装：

一路下一步即可。

1.2 检验

ollama安装后默认已经启动，我们可以通过访问其提供的api服务来进行检验。

参考官方文档：ollama的api · ollama/ollama · GitHub

这里运行ollama的机器为windows系统， ip为192.168.3.154。

1.2.1 通过localhost检验

运行命令：

> curl http://localhost:11434/api/generate -d "{\"model\": \"qwen2\",\"prompt\": \"who are you?\",\"stream\":false}"

查看结果：

这里注意两点：

1、不要使用PowerShell(里面的curl参数不一样)，使用 cmd 或者 git Cmd 。

2、注意参数的引号，通过斜杠 \ 来转义。

1.2.2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

旭日跑马踏云飞

关注关注

79
点赞
踩
198

收藏

觉得还不错? 一键收藏
6
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

大模型管理工具Ollama搭建及整合springboot

congge_study的博客

06-01

1万+

Ollama搭建与部署使用

零基础入门AI大模型应用开发——第一天：大模型本地部署，调用大模型API可直接工程化应用（全部代码和详细部署流程）

qq_34717531的博客

07-05

3330

Ollama 是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。以下是其主要特点和功能概述：1. 简化部署：Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程，使得非专业用户也能方便地管理和运行这些复杂的模型。2.轻量级与可扩展：作为轻量级框架，Ollama 保持了较小的资源占用，同时具备良好的可扩展性，允许用户根据需要调整配置以适应不同规模的项目和硬件条件。

6 条评论您还未登录，请先登录后发表或查看评论

ollama接口调用

每天学习一点点

03-11

1003

(float, 可选): 控制生成文本的随机性。值越低，生成的文本越确定。(array of strings, 可选): 指定停止生成的条件。(array of integers, 可选): 上下文 token 列表，用于保持对话或生成的一致性。(integer, 可选): 限制采样时考虑的 top-k 词汇数量。(integer, 可选): 生成文本的最大长度（以 token 为单位）。(integer, 可选): 随机种子，用于控制生成的可重复性。(integer): 生成评估的 token 数量。

【LLM】Ollama：本地大模型 WebAPI 调用

m0_74824496的博客

12-11

1万+

从下载并安装。

Ollama笔记02——Ollama API 交互、Ollama 模型交互与Ollama Open WebUI的安装

热门推荐

u010522887的专栏

07-24

3万+

Ollama 也许是当前最便捷的大模型部署工具，配合Open WebUI，人人都可以拥有大模型自由。

本地大模型1：安装部署本地Ollama大模型

weixin_74825941的博客

09-10

2万+

对ollama本地大模型的基本使用，下载了llama3.1:8b，可以进行基本的问答，推荐了两篇调用ollama的文章

2000+多种开源大模型随意部署！一键搭建本地大模型，不挑环境、不挑配置（ollama 安装部署教程《Windows/Linux，Mac》）

淘小欣的博客

10-21

2727

Ollama是一个支持在WindowsLinux和MacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如Qwen模型等。用户只需一行命令就可以启动模型。跨平台支持WindowsLinuxMacOS系统。提供了丰富的模型库,包括QwenLlama等1700+大语言模型,可以在官网中直接下载使用。支持用户上传自己的模型。用户可以将等地方的ggml格式模型导入到ollama中使用。也可以将基于pytorch等格式的模型转换为ggml格式后导入。允许用户通过编写。

Ollama 安装部署

cliffordl的专栏

02-05

4425

linux 参考：https://blog.csdn.net/zhu7478848/article/details/140514582。在搜索结果中，你会看到 Qwen 的不同版本，如 Qwen 2.5 和 Qwen 2 等，这里我们选择安装 Qwen 2.5 版本。参考：https://blog.csdn.net/zengmingen/article/details/143687404。在任务管理器中，点击“进程”选项卡，找到名为“ollama.exe”和“Ollama.exe”的进程。

大语言模型本地部署框架Ollama：多平台支持与丰富的模型库助力便捷应用

01-31

内容概要：Ollama 是一款开源大语言模型（LLM）本地部署框架，以其广泛的跨平台兼容性（涵盖 Windows、macOS、Linux 和 Docker）、丰富的开源模型库和支持多种编程及脚本语言的 API 集成特点而受到关注。此外，它...

LLM大模型部署实战指南：Ollama部署简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开发【含ollama详细部署指南多版本】

丨汀、的博客

08-13

1万+

LLM大模型部署实战指南：Ollama简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开发

使用Ollama进行大模型的api部署

xuptyjs的博客

10-29

1万+

使用Ollama进行大模型的api部署有两种方式：原生接口和openai兼容接口。

详解Ollama api (Windows环境)

TeamLee的博客

12-24

5052

在Windows中调用Ollama API的基本思路其实就是网络爬虫，无论是在powershell中还是在Python中。但是Ollama API的调用模式有很多种，基本上所有的Ollama模型操作都可以通过API来完成。

大模型Ollama RestAPI 详解

王小工小工历程

02-11

2751

Ollama 是一个开源的本地化工具，允许用户在本地运行大型语言模型（如 LLaMA、Mistral、Gemma 等），并通过 REST API 与模型交互。

AI学习指南Ollama篇-通过API与Ollama交互

俞兆鹏的博客

01-27

1015

Ollama作为一款本地大语言模型部署工具，以其高效、安全和易于使用的特点受到广泛关注。通过Ollama，用户可以在本地设备上运行和管理大语言模型，避免了云端部署带来的隐私和性能问题。Ollama API是一个RESTful风格的接口，允许用户通过HTTP请求与Ollama服务进行交互。它支持多种编程语言的集成，提供了丰富的功能，包括模型管理和文本生成。curl是一个强大的命令行工具，用于发送HTTP请求。它简单易用，适合快速测试API接口，无需编写复杂的代码。

ollama python api调用response

12-25

Ollama是一个API服务，它可能并不是Python原生提供的库，而是某个第三方平台或项目提供用于Python交互的客户端。为了调用Ollama API并获取响应，你需要首先安装相关的库（如果有的话），例如`requests`，然后按照官方文档的指示编写Python代码。以下是一个简单的例子： ```python import requests # 定义API URL 和需要的参数 api_url = "https://your_ollama_api_endpoint.com" # 替换为实际的API地址 headers = {'Authorization': 'Bearer your_access_token'} # 如果需要认证，请添加合适的令牌 params = { 'param1': 'value1', 'param2': 'value2' } # 需要传递的数据 # 发送GET或POST请求 response = requests.get(api_url, headers=headers, params=params) # 检查响应状态码 if response.status_code == 200: data = response.json() # 如果是JSON格式的响应 print("响应数据:", data) else: print(f"请求失败，状态码：{response.status_code}") #