零基础也能搞定!快速搭建本地大型语言模型指南

1、前言

​ 在这篇文章中,我们将介绍如何在本地快速、简单地搭建属于自己的大型语言模型,实现自由自在的本地对话。整个过程不需高深技术,只需要具备下载程序、安装程序、执行命令行的基础技能,无需科学上网即可完成。

在这里插入图片描述

2、为什么需要本地的大语言模型

  1. 随时随地使用AI:使用AI已经成为我们日常工作的一部分,相当于第二大脑。不论是写文章、写代码还是回邮件,都离不开它。商用的大模型需要联网使用,但是打工人随时随地都有被召唤工作的可能。有了本地大模型,不论是在地铁、高铁、飞机上,可以在无网络环境下使用AI。

  2. 数据安全:商用的大模型在对话过程中,会将内容用于自身的训练。就像下图Google gemini的说明,其他商用大模型也会有类似的说明

    在这里插入图片描述

    如果对话涉及个人隐私或公司机密,存在数据泄漏的风险。本地模型可以有效避免这种问题。

  3. 执行特定领域模型:商用模型多为通用型,但在医学、金融、工程等领域,存在专属的大型语言模型。通过本地部署,可以运行这些特定功能的模型,甚至公司可以根据业务需求训练专用模型供内部使用。

    下面的示例是由复旦大学数据智能与社会计算实验室 (Fudan-DISC)开发并开源DISC-MedLLM,是一个专门针对医疗健康对话式场景而设计的医疗领域大模型

在这里插入图片描述

3、如何搭建本地大型语言模型

我们依照下面的步骤来搭建大模型

  1. 安装大模型执行程序

    我们选择使用 Ollama,一个开源框架,用于本地运行大型语言模型(LLM)。它的主要特点包括:

  • 简化部署:Ollama使得管理和运行模型变得更加容易。
  • 捆绑模型组件:将模型权重、配置和数据捆绑到一个包中,称为Modelfile,优化设置和配置细节,包括GPU使用情况。
  • 支持多种模型:支持多种大型语言模型,如Llama 2、Code Llama、Mistral、Gemma等,用户可以根据需求定制和创建模型。
  • 内建开放API:安装后即提供API,支持其他应用通过API调用其对话功能。

安装非常简单,可访问 Ollama官网 https://ollama.com/download 进行下载。下载后执行安装即可

在这里插入图片描述

2. 选择合适的大模型

除了商用模型如ChatGPT、文心一言,还有很多开源模型可供选择。推荐中文模型“阿里的通义千问”,其特点包括:

  • 中文开放域通用模型:支持中文开放域语言表达检测和标注。

  • 多语言对话模型:支持多语言对话,能识别图片中的中英双语长文本。

  • 全尺寸、全模态开源:提供从18亿到720亿参数规模的模型,以及视觉理解、音频理解的多模态模型。

    在Ollama上安装通义千问也很简单,只需命令行执行

ollama run qwen:1.8b

下载速度快

在这里插入图片描述

安装完成后即可开始对话。

在这里插入图片描述

​ 通义千问提供参数不同大小的模型,模型越大性能越强,对话的内容也更丰富,但需要更多的显卡内存。查看电脑显卡内存,可打开任务管理器,切换到性能页查看GPU内存大小。

​ 下面整理不同模型大小执行时需要的GPU内存大小

参数规模模型大小GPU内存大小
0.5b394 MB1.3 GB
1.8b1.1 GB2.0 GB
4b2.3 GB3.5 GB
7b4.5 GB6.5 GB
14b8.2 GB10.5 GB
32b18 GB18.8 GB

最佳策略:是在小于电脑显卡的内存的条件下,选择最大的模型

3. 安装Web界面

除了命令行模式,我们还可以使用类似ChatGPT的Web界面工具来增加我们的使用体验,这个工具是Open Webui。这个界面不单单是介面还包含对话历史、文件解析、多用户管理的功能,所以官方使用打包成一个docker安装使用,安装步骤也很简单

(1)安装Windows Docker:访问Docker官网下载 https://docs.docker.com/desktop/install/windows-install/ Windows桌面版并安装。

在这里插入图片描述

(2)执行命令行指令:

安装docker

docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

(3) 连接到本地Web界面: 打开浏览器,访问 http://localhost:3000。第一次使用需注册Email,此步骤仅为本地身份验证,用来区分不同账号,企业也可以用不同账号让员工在内网使用。

在这里插入图片描述

(4)开始使用:注册完成后即可开始使用Web界面。

在这里插入图片描述

通过以上步骤,您已成功在本地搭建了自己的大型语言模型,享受随时随地、安全高效的AI对话体验。

4、结语

​ 总的来说,搭建一个本地的大模型并不困难,只需要几个简单的步骤。拥有一个专属的AI助手,不仅可以随时随地使用,还可以避免敏感数据泄露的风险。对于个人用户或企业来说,本地大模型绝对是一个值得尝试的选择,它将为工作和生活带来全新的体验。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值