MNN-LLM 项目教程

最新推荐文章于 2024-08-28 01:19:15 发布

时翔辛Victoria

最新推荐文章于 2024-08-28 01:19:15 发布

阅读量431

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gitblog_00326/article/details/141075524

版权

MNN-LLM 项目教程

mnn-llmllm deploy project based mnn.项目地址:https://gitcode.com/gh_mirrors/mn/mnn-llm

1. 项目介绍

MNN-LLM 是一个基于阿里巴巴 MNN 框架的大语言模型端侧部署项目，专注于在 CPU 上进行高效的推理优化。该项目旨在解决大型语言模型（LLM）在移动端和低内存环境下的实时性问题，特别是在 ARM 架构的 CPU 上表现优秀。MNN-LLM 提供了对多个主流开源 LLM 模型的支持，并通过 llm-export 工具简化模型导出流程。

2. 项目快速启动

安装依赖

确保已安装 Git 和 C++ 编译环境，以及 MNN 的依赖项。对于 Android 和 iOS，还需要相应的开发环境。

下载项目

git clone https://github.com/wangzhaode/mnn-llm.git
cd mnn-llm

Android 快速编译

./android_build.sh

iOS 编译

在 Xcode 中打开 ios/MNNLLM.xcodeproj 文件并进行编译。

Python 包装器

如果你需要在 Python 中使用 MNN-LLM，可以通过以下步骤：

pip install .

之后，你可以参照 python 目录中的示例代码来调用 MNN-LLM API。

3. 应用案例和最佳实践

端侧实时对话：利用 MNN-LLM，在内存低于 2GB 的设备上，实现 Qwen-1.8B 模型的端侧实时会话能力。
文本处理：在低功耗设备上进行快速的文本分析、问答和生成任务。
资源优化：通过 MNN 模型转换工具优化模型大小，减少内存占用。

推荐最佳实践：

对于内存有限的场景，可选择较小规模的模型，如 Qwen-1.8B。
利用 4-bit 量化技术降低模型计算量，提高 CPU 效率。

4. 典型生态项目

llm-export: 提供统一的 LLM 模型导出方案，简化预训练模型到 ONNX 格式的转换过程。
MNN: 主动的神经网络推理引擎，支持跨平台、跨架构的部署，包括 MNN-LLM 项目的基础。
ChatGLM-MNN: 原来的特定模型部署项目，已被整合到 MNN-LLM。

了解更多细节和具体使用方法，建议查阅项目官方文档 README 和示例代码。

mnn-llmllm deploy project based mnn.项目地址:https://gitcode.com/gh_mirrors/mn/mnn-llm

时翔辛Victoria

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

时翔辛Victoria 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。