如何在局域网中调用服务器的大模型呢？

Fz2h

已于 2024-09-09 09:03:04 修改

阅读量351

点赞数 5

文章标签：语言模型 python 服务器 ubuntu

于 2024-09-08 23:39:26 首次发布

本文链接：https://blog.csdn.net/binger_123/article/details/141949002

版权

记录一下大模型的相关部署过程

步骤非常简单可靠：

我是使用ollama进行服务器端的部署。服务器端的系统版本是ubuntu18.04。

服务器无法直接下载ollama

直接用官方的方式先下载脚本，再运行那个脚本的方法下载ollama的时候，遇到了下载速度慢，进度卡住了超时等困难。

尽管我搜到了国内如何下载ollama的一些方法，例如修改下载脚本等。但是我觉得这些方法的实操难度有点高。

经过我的搜索之下，我发现snap软件库中居然有ollama的软件包。所以就直接使用snap下载ollama。

参考链接：用snap下载ollama

可以直接使用ollama下载对应的模型

不过呢，这个ollama的版本不是很高的缘故，所以llama3.1下载了也不能使用，但是可以使用llama3。

构造局域网

这一步我是直接使用一个路由器，让客户端和服务器共同连在同一个wifi下面，这样他们之间就能相连了。

客户端电脑和服务端电脑能否互连可以尝试相互Ping一下对方的IP地址

服务器开放api

使用非常简单的Fastapi库，可以实现简单的api的请求

使用langchain快速构造大语言模型的Pipeline以及连接ollama server

如有更多问题，可以在评论留下。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Fz2h

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Ollama局域网内访问

Criss@陈磊

04-29

2721

我们平时面对的场景中，服务器往往并不能链接互联网，因此我们就不能用上面介绍的Ollama的命令一样，运行命令直接获从Ollama中央仓库下载一个模型，Ollama为我们提供了一个导入模型的办法。那么如果有些模型没有量化的模型的话，就需要自己动手了，这个主要是借助llama.cpp完成的，具体操作就不做详细说明了，需要的时候，在网上学习吧。选择我的电脑点击右键，选择属性后点击高级系统设置就可以看到环境变量的按钮了，点击进入后可以看到有上下两部分，上面是用户变量，下面是系统变量。重新载入配置，再通过。

设置Ollama在局域网中访问的方法（Ubuntu）

qysh123的专栏

04-22

7332

趁着Llama3的热度试了一下Ollama，果然部署推理大模型很有用。一个现实的需求是，如果我们要在局域网中访问Ollama上大模型的服务，应该怎么办呢？参考了一下其他博客的方法。就可以通过局域网或者另一台机子上的LangChain调用了。其次配置防火墙，打开端口。首先打开Ollama的配置文件。

参与评论您还未登录，请先登录后发表或查看评论

【AI 大模型】函数调用 Function Calling ① ( 人机交互接口与应用程序编程接口 | 语言界面接口 | AI 大模型缺陷与补救措施 | 函数调用为大模型赋能真逻辑 )

让学习成为一种习惯 ( 韩曙亮の技术博客 )

07-09

8036

一、接口概念 1、接口类型 - 人机交互接口 / 应用程序编程接口 2、人机交互口的发展 - 命令行 -> 图形界面 -> 语言界面 -> 脑机 3、应用程序编程接口的发展 - 本地 -> 远程 -> 自然语言接口二、AI 大模型缺陷与补救措施 - 函数调用 Function Calling 引入 1、AI 大模型原理 2、AI 大模型缺陷 3、函数调用 Function Calling 引入 4、" 真逻辑 " 要求 5、函数调用 Function Calling 为大模型赋能 " 真逻辑 "

本地部署大模型？Ollama 部署和实战，看这篇就够了

u010522887的专栏

07-24

9274

Ollama 也许是当前最便捷的大模型部署工具，配合Open WebUI，人人都可以拥有大模型自由。

本地部署大模型？看这篇就够了，Ollama 部署和实战

Everly_的博客

07-29

2897

前几篇，分享的都是如何白嫖国内外各大厂商的免费大模型服务~有小伙伴问，如果我想在本地搞个大模型玩玩，有什么解决方案？Ollama，它来了，专为在本地机器便捷部署和运行大模型而设计。也许是目前最便捷的大模型部署和运行工具，配合Open WebUI，人人都可以拥有大模型自由。今天，就带着大家实操一番，从 0 到 1 玩转 Ollama。

java多线程局域网聊天，服务器+客户端

10-29

- **广播和发现**：在局域网中，服务器可能会通过广播来通知客户端其存在，客户端则通过监听广播来发现服务器。 6. **用户界面（UI）**： - **图形用户界面**：通常使用Java的Swing或JavaFX库创建聊天窗口，处理...

xyzngbkz_gp_xz.rar_csharp voice chat_客户端 服务器 Csharp_局域网语音_语音聊天

09-24

在C#中，可以使用Socket的BeginReceive方法开启异步接收，当接收到数据时，调用EndReceive完成接收，并触发新的接收操作。 5. **客户端解码与播放**：客户端接收到数据后，先解码成PCM格式，NAudio的Mp3FileReader...

同步局域网服务器时间类库

10-08

开发人员可以将这个库导入到他们的项目中，通过调用库提供的API函数来实现局域网内的服务器时间同步。不过，具体的使用方法和API细节通常会在类库的文档或示例代码中提供，以帮助开发者更好地理解和应用。

局域网聊天系统—服务器端

06-10

在本项目中，我们关注的是一个局域网聊天系统，其服务器端部分是用C/S（客户端/服务器）架构设计的。C/S架构是一种常见的网络通信模型，它由客户端应用程序和服务器程序组成，使得多个客户端可以同时与单一服务器...

Python办公自动化案例（二）：对比两个Excel数据内容并标出不同

衍生星球的博客

09-14

343

在数据处理和分析的日常工作中，我们经常需要比较两个Excel文件的差异。这可能是为了验证数据的一致性、检查数据的准确性，或者在版本控制中追踪更改。手动比较这些文件不仅耗时，而且容易出错。幸运的是，Python的openpyxl库提供了一种自动化这一过程的方法。

Python世界：力扣29题两数相除算法实践

来知晓的博客

09-13

378

除法运算本质是减法，从理解原理到真正实现还是有距离，建议初步理解后，不参考任何代码，完全自己复现一遍，体会更深。注意提示：目的就是提醒越界问题：-2^31/-1=2&31，超过了整数表达范围。本问题来自于力扣29题，在做完大数相乘后，顺带也看下两数相除。将两数相除，要求不使用乘法、除法和 mod 运算符。给定两个整数，被除数。

Tcl lnit error: Can’t find a usable init.tcl in the following directories 问题解决

梦想闹钟

09-15

273

实际研究后发现，其实py2exe已经把打包需要的lib放在dist文件夹下了，但是打包后的程序运行后却没有去lib下找，而是去找系统自带的环境变量里找，所以找不到。这个问题出现在我用py2exe打包了一个包含tkinter的图形化界面，在当前电脑上运行无问题，在移动到新电脑上后提示报错、getcwd用于获取当前工作目录绝对路径，在设置环境的变量的时候它用的是绝对路径-所以也导致了在当前电脑上能用而移动后不能用。解决方法是在你的程序里重新设置下环境变量，而且是用相对路径的形式。

JUC从实战到源码：中断机制与API实现

qq_43843951的博客

09-12

1135

在Java中，线程中断是一种机制，用于通知线程应该停止当前正在执行的任务。中断通常用于协同线程之间的合作，以便让线程在适当的时候终止其工作，尤其是在长时间运行的任务或阻塞操作中。通过学了多线程以及synchronized的相关知识，接下来就到了学习线程中断知识。

opencv学习：calcHist 函数绘制图像直方图及代码实现

mohanyelong的博客

09-13

1452

opencv学习：calcHist 函数绘制图像直方图及代码实现

基于机器学习的乳腺癌肿瘤智能分析预测系统

最新发布

Python极客之家

09-16

766

本系统致力于通过分析肿瘤的各种特征，如半径、纹理、形状等，利用Matplotlib、Seaborn 等工具进行可视化统计分析，并建立机器学习模型来预测肿瘤是否为恶性，测试集预测 AUC 达到 98.441%。系统的设计目的是为了帮助医疗专业人员更快地做出决策，并为患者提供更及时的治疗方案。

面试真题 | web自动化关闭浏览器，quit()和close()的区别

NHB234567的博客

09-13

316

关闭所有的浏览器窗口，销毁driver操作，则需要使用的是quit方法；当打开了多个窗口，只想要关闭非最后一个窗口的时候，使用的是close方法。这些资料，对于【软件测试】的朋友来说应该是最全面最完整的备战仓库，这个仓库也陪伴上万个测试工程师们走过最艰难的路程，希望也能帮助到你！close():只关闭当前的浏览器标签页，如果当前浏览器标签页剩下最后一个，则所有标签页面退出。是否编写过对应浏览器退出的测试用例。quit():所有的浏览器窗口退出。关闭当前的标签页，其他窗口不退出。退出当前所有的窗口；

Python——俄罗斯方块

2302_81225694的博客

09-14

894

这段代码使用了Pygame库来实现游戏的图形界面，通过键盘控制方块的移动和旋转。游戏循环不断更新方块的位置和网格状态，并绘制在屏幕上。在方块达到底部或无法继续移动时，判断是否有满行，并清除满行的方块。游戏会根据方块的状态和移动情况不断更新，直到无法继续下落为止，游戏结束。俄罗斯方块游戏是一款经典的益智游戏，通常使用编程语言Python来实现。请注意，这只是一个简单的示例，可能还有一些功能和优化方面的改进。您可以根据自己的需求进行修改和扩展。

2024.9.16 day 1 pytorch安装及环境配置

m0_58285219的博客

09-16

359

pytorch安装及环境配置

【Go】-Context库的使用

knoci的博客

09-13

760

当截止日过期时，当调用返回的cancel函数时，或者当父上下文的Done通道关闭时，返回上下文的Done通道将被关闭，以最先发生的情况为准。取消此上下文将释放与其相关的资源，因此代码应该在此上下文中运行的操作完成后立即调用cancel，通常用于数据库或者网络连接的超时控制。用来处理一个请求的 goroutine 通常需要访问一些与请求特定的数据，比如终端用户的身份认证信息、验证相关的token、请求的截止时间。取消此上下文将释放与其关联的资源，因此代码应该在此上下文中运行的操作完成后立即调用cancel。