Llama2模型本地部署(Mac M1 16G)

置顶 linyu19872008

已于 2024-04-12 18:41:36 修改

阅读量989

点赞数 4

文章标签： macos llama AI

于 2024-04-12 18:33:34 首次发布

本文链接：https://blog.csdn.net/linyu19872008/article/details/137690245

版权

环境准备

环境：Mac M1 16G、Conda

Conda创建环境配置

使用Anaconda-Navigator创建python 3.8环境

切换到新建的conda环境：

conda activate llama38

llama.cpp

找一个目录，下载llama.cpp

git clone https://github.com/ggerganov/llama.cpp

进入llama.cpp目录

cd llama.cpp

安装依赖环境

pip install -r requirements.txt

编译代码

LLAMA_METAL=1 make

下载中文模型 chinese-alpaca-2-7b-64k-hf，可以去下面的地址查找GitHub - ymcui/Chinese-LLaMA-Alpaca-2: 中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)

我这边选用的7b模型，再大就不好运行起来了

下载后放置在llama.cpp/models目录下

模型转换

python convert.py models/chinese-alpaca-2-7b-64k-hf/

量化模型

./quantize ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-f16.gguf ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-q4_0.gguf q4_0

Server方式启动, host和port可选, 不写则启动127.0.0.1 8080

./server --host 0.0.0.0 --port "$port" -m ./models/chinese-alpaca-2-7b-64k-hf/ggml-model-q4_0.gguf -c 4096 -ngl 1

启动成功直接打开页面，我这边没有指定host和port，http://localhost:8080/

开始对话

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

linyu19872008

关注关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
Llama2模型本地部署(Mac M1 16G)

环境：Mac M1 16G、Conda。
复制链接

扫一扫

5分钟在MAC下本地搭建大模型

wushakun的博客

03-26

2340

Ollama——一个简明易用的本地大模型运行框架。随着围绕着 Ollama 的生态走向前台，更多用户也可以方便地在自己电脑上玩转大模型了。Ollama 的目标是帮助开发者在本地运行、创建和共享大型语言模型。Ollama 目前处于早期预览阶段，但已经提供了一些核心功能。例如，它支持运行和对话 Llama 2，这是 Meta 新推出的模型。此外，Ollama 还提供了一个模型库，开发者可以在这里下载和使用各种开源模型。

Llama2通过llama.cpp模型量化 Windows&Linux本地部署

早安不安的博客

11-11

7691

本地部署和使用llama.cpp进行量化Llama2，linux和Windows平台方案，支持CPU和GPU多版本。

参与评论您还未登录，请先登录后发表或查看评论

基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人

m0_59235699的博客

05-27

2808

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

中文大语言模型 Llama-2 7B（或13B）本地化部署（国内云服务器、GPU单卡16GB、中文模型、WEB页面TextUI、简单入门）

zero2100的专栏

10-13

5201

tailnvidia-smi注意：使用 nvidia-smi 查看CUDA 版本必须是 11.8。

本地部署Chinese-llama-2-7b模型（Windows）

m0_62852701的博客

03-25

752

所以我们需要去下载一个大模型添加到里面，我用的是Chinese-llama-2-7b的模型，还有一个1.3b的模型，稍显笨拙一点，所以我的建议是。部署大模型有着多种方式，但是我用的是一键安装的方式，在网上可以找到很多一键安装包，方便简洁。1.在下载一键安装包的时候，建议新建文件夹，并且为全英文的路径，不然容易报错。3.7b的模型可能语料库还是不够多，在聊天的时候可能有些问题，自己多试试。模型下载好以后，需要。

利用docker一键部署LLaMa2到自己的Linux服务器支持视觉识别支持图文作答支持中文，有无GPU都行、可以指定GPU数量、支持界面对话和API调用，离线本地化部署包含模型权重合并

代码讲故事

02-23

2120

利用docker一键部署LLaMa2到自己的Linux服务器支持视觉识别支持图文作答支持中文，有无GPU都行、可以指定GPU数量、支持界面对话和API调用，离线本地化部署包含模型权重合并。两种方式实现支持界面对话和API调用，一是通过搭建text-generation-webui。二是通过llamma.cpp转换模型为转换为 GGUF 格式，使用 quantize 量化模型，使用 llama.cpp 运行 GGUF 模型。

在个人电脑上,本地部署llama2-7b大模型

lidashent的博客

04-14

885

我想也许很多人都想有一个本地的ai大语言模型,当然如果能够摆脱比如openai,goole,baidu设定的语言规则,可以打破交流界限,自由交谈隐私之类的,突破规则,同时因为部署在本地也不担心被其他人知道,那最好不过了那究竟有没有这样的模型呢?llama2-7b模型就可以同时你也可以为他设定角色,这是一个支持可进行身份定义的本地语言模型,而非固定角色。

本地部署开源大模型的完整教程LangChain + Streamlit+ Llama

09-23

然后，我们使用GGML格式的本地模型，直接从Hugging Face Models存储库下载bin文件，并将文件移动到根目录下的models目录中。七、使用LLaMA-CPP-Python 为了使用LLaMA模型，我们需要使用 llama-cpp-python，这是...

Llama3模型+Windows本地运行软件（下载地址）

05-20

Meta放出Llama3模型了，也应该是这段时间里的一个科技大新闻了。 Llama一直都是开源大语言模型的领头羊驼。而Llama3又是所有羊驼中最新的领头羊。可以简单地来看一下官方的对比数据。下面是Llama3和谷歌...

大模型部署-基于Java+多GPU实现LLaMA2推理部署-附项目源码-优质项目实战.zip

05-25

在当前的IT行业中，大模型部署是人工智能领域的一个重要话题，尤其对于自然语言处理和计算机视觉等应用。本文将深入探讨如何使用Java编程语言结合多GPU环境来部署LLaMA2大模型，同时提供了一个优质的实战项目源码，...

大模型部署-在本地计算机上推理LLaMA大语言模型-支持Windows+Linux+Mac-优质项目实战.zip

03-26

本项目实战旨在教你如何在本地计算机上部署大型语言模型LLaMA（Large Language Models like MAth）进行推理工作，覆盖Windows、Linux和Mac操作系统。大模型部署是一项技术性极强的任务，涉及到高性能计算、资源管理...

大模型部署-使用OpenVINO本地化部署LLaMa3-附项目源码+流程教程-优质项目实战.zip