本地部署AI大模型

最新推荐文章于 2025-05-06 11:34:37 发布

六月生花

最新推荐文章于 2025-05-06 11:34:37 发布

阅读量381

点赞数 6

文章标签： chatgpt

本文链接：https://blog.csdn.net/weixin_45555414/article/details/141937704

版权

mac windows 同理

用到的软件 docker ollama 大家可以到官网下载

在ollama官网选择models，这里面有用到的大模型

我用到的是 qwen2 ，这个对中文比较友好

注意，每个模型有不同的参数版本，参数量越大，对电脑配置越高，越聪明，一搬选择7b就可以了

复制一下给到的命令 ollama run qwen2:7b

打开终端，用管理员身份运行刚复制的命令

sudo ollama run qwen2:7b

这时会进入下载，耐心等待下载完毕

这时候就可以聊天了

2、如果想用聊天框的形式可以利用docker实现

首先电脑安装docker

接着安装 open-webui

找到How to Install下的第一个命令

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

打开命令行把刚才复制的内容粘贴进去等待安装

成功后如图

这时候docker里面就有刚下载的 open-webui了

打开

打开后选择对应的模型

这时候就可以聊天了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

六月生花

关注关注

6
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

本地部署免费AI大模型+知识库

07-11

734

学习链接：https://www.bilibili.com/video/BV1zZ421T7Ep/spm_id_from=autoNext&vd_source=20a76bd7aa0358839f0334c33018daa6。成功后回自动弹出浏览器页面，如果没有弹出，你可以手动在搜索栏输入“使用效果：【生成答案速度太慢，基本答非所问，体验感不太行……",跳转进入页面或者进入docker中点击跳转链接。4.使用其他开源大模型，比如qwen2。2.下载之后按照提示一步步安装即可。2.命令行中运行命令。

五个简单好用的本地运行大模型的方法

wjianwei666的专栏

04-21

1588

像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理。在平台上尤其如此，在这些平台上，你的互动可能会被人类审查，并以其他方式用于帮助训练未来的模型。一种解决方案是下载一个大型语言模型（LLM）并在自己的机器上运行它。这样一来，外部公司就永远无法访问的数据。这也是尝试一些新专业模型的一个快速选择，如Meta最近宣布的Code Llama系列模型，这些模型经过了编码调整，以及Seamless M4T，旨在实现文本到语音和语言翻译。

参与评论您还未登录，请先登录后发表或查看评论

AI大模型本地部署保姆级教程：三种方法，轻松上手

2401_85390073的博客

02-20

1960

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

本地部署大模型的几种方式

2301_81940605的博客

05-29

4999

现在大模型可谓是满天飞, 只要你稍微关注时下的AI资讯, 几乎每天都有新的AI大模型出现. 这之中当然有诸如GhatGPT, Gemini这样的私有化大模型, 更吸引人关注的可能是开源的可私有化部署的一些大模型.

AI角色扮演游戏框架SillyTavern（酒馆）的本地与云服务器搭建

sanshanjianke的博客

02-05

2万+

本文介绍SillyTavern（酒馆）AI角色扮演游戏的玩法。并考虑到AI模型服务商API的不稳定性，以及功能限制，本文演示基于本地系统与基于云服务器的AI模型搭建，为SillyTavern的使用提供API接口。文中将介绍SillyTavern的搭建即其原理；介绍AI模型框架，AI模型，并分析优劣与问题，同时推荐相应模型；介绍云服务器的选择并根据需求分析各云服务商和云服务器，以便读者选择；分别在Linux和Windows环境下搭建模型；介绍如何穿透没有购买公网的云服务器并通过转发API配置Silly

大模型本地部署保姆级教程！三种方法教会你如何部署~

热门推荐

2401_85373898的博客

10-07

2万+

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

打造个人AI大模型：本地电脑部署全攻略_本地部署ai大模型

2401_84208172的博客

03-17

1167

现在的ai很多，让我看得有些眼花缭乱，随着ai的发展，现在已经有很多ai的大模型已经支持开源，所以现在支持部署一个大模型在自己电脑上，数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受

教你在本地部署AI大模型，效果很赞！

2401_85373396的博客

09-20

4464

随着人工智能的发展，AI与我们的工作与生活变得越来越紧密。AI大模型主要分为开源和不开源两类。现如今开源模型变得越来越好，甚至超过了很多不开源的大模型。前不久谷歌发布了gemma2模型的2B版本(20亿参数)，让我们能够在性能十分有限的电脑上也能流畅运行本地大模型。在我的小破笔记本上都可以流畅出色运行，而且效果很赞！

打造个人AI大模型：本地电脑部署全攻略

m0_63171455的博客

08-15

2万+

现在的ai很多，让我看得有些眼花缭乱，随着ai的发展，现在已经有很多ai的大模型已经支持开源，所以现在支持部署一个大模型在自己电脑上，数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。

本地离线部署Ai大模型的三种方案，含安装教程！

python123456_的博客

05-29

6791

在GPU下运行：docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。把我们的模型放到对应的文件夹中。

非常可靠，手把手教你本地部署AI大模型-llama3:70b

lvaolan8888的博客

06-06

3538

Llama 3是Meta 公司开发的Llama系列模型的第三个版本，本次提供 8B 和 70B 参数大小的版本。Llama3拥有改进的推理能力。

本地部署开源大模型的完整教程LangChain + Streamlit+ Llama

09-23

本地部署开源大模型的完整教程 LangChain + Streamlit+ LLaMA 本教程旨在指导开发人员如何在本地部署开源的大型语言模型（LLM），并使用LangChain、Streamlit和LLaMA等工具来创建交互式应用程序。以下是教程中涉及...

本地部署AI大模型（以deepseek-r1为例）

2404_89044122的博客

02-15

810

本地部署AI模型，使用open-webui(docker)+ollama

本地部署AI大模型之PyTorch：如何在本地安装PyTorch

m0_37982378的博客

02-13

779

目前，人工智能（AI）在飞速发展中，很多人开始学习AI。在学习AI的过程中，大家可能听过一些机器学习的框架，比如PyTorch。那么，如何在我们自己的电脑中（Windows环境）安装PyTorch呢？这篇文章将给大家介绍详细的步骤。

本地部署AI大模型之RAG：详解什么是RAG

m0_37982378的博客

02-19

514

RAG（检索增强生成）融合检索与生成式大语言模型，通过检索外部知识库信息辅助生成，提升模型在问答、文本摘要等知识密集型任务中的表现。它解决传统语言模型知识时效性不足、易出事实性错误及领域局限性等问题，具有提高回答准确性、增强内容可追溯性等优势，关键组件包括检索器、外部知识库和生成器，典型应用场景涵盖问答系统、客服助手、学术研究等。

ChatGPT：重塑人工智能交互范式的破晓之作

源滚滚编程

05-03

627

从GPT-3.5到ChatGPT，再到DeepSeek等竞品的涌现，大语言模型正经历从“能力竞赛”到“应用落地”的范式转移。在效率与责任、创新与监管的平衡中，ChatGPT引发的这场AI革命，或许只是人类迈向通用人工智能（AGI）漫长征途的第一步。尽管ChatGPT仍以4亿周活跃用户的绝对优势主导市场，但DeepSeek等对手的崛起表明，AI聊天机器人的竞争已进入“细分场景深耕”阶段。ChatGPT的持续进化，例如2024年推出的高级语音模式和o1推理模型，正是这一趋势的缩影。

怎样通过API 实现python调用Chatgpt，gemini

最新发布

ZJQ的博客

05-06

120

# 可选参数：控制输出的随机性，值在 0 到 2 之间，默认 1 temperature=0.7, # 可选参数：控制输出的多样性，值在 0 到 1 之间，默认 1 top_p=0.8, # 可选参数：限制生成回复的最大令牌数 max_tokens=150, # 可选参数：生成多个候选回复，默认 1 n=2, # 可选参数：是否流式输出，默认 False stream=False, # 可选参数：停止生成回复的标记，可以是字符

17. LangChain流式响应与实时交互：打造“类ChatGPT“体验

m0_60414444的博客

05-01

955

2025年某在线教育平台的AI助教引入流式交互后，学生平均对话轮次提升3.2倍，完课率提高47%。本文将基于，揭秘如何实现毫秒级响应的自然对话体验。

当LLM遇上Agent：AI三大流派的“复仇者联盟”

neweastsun的专栏

05-02

976

最近，**Agent（智能体）**开始崛起，它能让AI像人一样自主决策、执行任务，甚至“组团打怪”。先学LLM（毕竟它是“大脑”），再学Agent（让AI有“手”），最后碰行为智能（让AI有“身体”）。因为LLM是基于统计学习的，它“见过”珠穆朗玛峰是答案，但不“真正理解”为什么。LLM+Agent会像“钢铁侠+贾维斯”——你不用动手，AI自己搞定一切。这就是**Agent（智能体）**的威力——它让AI不仅会“说”，还会“做”。：AI的世界，没有“谁取代谁”，只有“谁和谁配合更好”。

什么本地部署ai大模型

03-28

### 本地部署 AI 大模型的方法和工具对于希望在本地环境中运行大模型的用户而言，有多种方法和工具可供选择。这些工具不仅能够帮助简化复杂的部署流程，还能提高资源利用率并优化性能。 #### 工具一：Docker 容器化解决方案容器技术是实现本地部署的一种常见方式。通过 Docker 将预训练的大模型封装成镜像文件，可以轻松地跨平台迁移和运行[^1]。这种方法的优势在于其隔离性和一致性，使得开发环境与生产环境之间的差异最小化。以下是使用 Docker 的基本步骤： ```bash docker pull model_registry/large_model:v1.0 docker run -it --gpus all -p 8501:8501 model_registry/large_model:v1.0 ``` 上述命令会拉取指定版本的大模型镜像，并启动支持 GPU 加速的服务端口映射[^2]。 --- #### 工具二：Hugging Face Transformers 和 Accelerate 库 Hugging Face 提供了一套完整的生态系统来处理自然语言处理 (NLP) 类型的任务。其中 `transformers` 是用于加载预训练模型的核心库，而 `accelerate` 则专注于加速推理过程以及降低硬件需求的影响。例如，可以通过以下 Python 脚本快速加载 BERT 或 GPT 系列模型： ```python from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("distilgpt2") model = AutoModelForCausalLM.from_pretrained("distilgpt2") input_text = "Hello world!" inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ``` 此脚本展示了如何利用 Hugging Face 生态系统完成简单的文本生成任务。 ---