手机本地部署端侧大模型

#最近在手机上部署了一个端侧大模型,把部署过程在这里记录一下#

一、本地运行模型的应用程序:ChatterUI

ChatterUI是一个在github上的开源项目,基于 React Native 构建的简单前端应用,用于管理聊天文件和角色卡片,并与大型语言模型进行交互。我把我正在用的版本直接放在了文章最下面,直接下载到手机安装即可。

二、模型格式转换成gguf格式

要在ChatterUI调用模型,需要把Hugging Face的safetensors转换为为gguf格式,以下是模型转换步骤:

1. 下载 llama.cpp仓库

可以直接从github上下载:https://github.com/ggerganov/llama.cpp ,或者下载我正在用的版本,链接放在了文章最下面。

2. 创建虚拟环境

直接用conda创建,Togguf是我自己的虚拟环境名称,懒得改可以直接复制命令运行。

conda create -n Togguf python=3.10

3. 配置环境

模型转换需要用到llama.cpp中的convert_hf_to_gguf.py,在运行直接先配置一下环境,把刚才下载的llama.cpp-master.zip解压,在cmd窗口中cd到该目录下,运行以下命令:

pip
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值