Phi-3 模型手机部署教程（微软发布的可与GPT-3.5媲美的小模型）

老牛同学

于 2024-06-23 10:08:51 发布

阅读量2k

点赞数 12

分类专栏： AI 文章标签： gpt-3 AI 人工智能大模型 Ollama Phi Termux

转载请注明原文链接：https://ntopic.cn

本文链接：https://blog.csdn.net/obullxl/article/details/139896227

版权

前面几篇博文，老牛同学和大家一起在个人电脑部署了Qwen2、GLM4、Llama3、ChatTTS和Stable Diffusion等 LLM 大模型，也通过 API 和 WebUI 的方式完成了体验。

但是这些大模型因为部署在个人电脑本地，不能够随时携带。如果能在手机上部署大模型的话，老牛同学感觉很有意义，手机与我们的生活更为密切相关，并且手机上也有大量的个人数据，与大模型交互起来也更加方便。同时，在手机上跑个大模型，还是很酷！

老牛同学期望能通过本文，和大家一起完成这项很酷且有意义的事情。老牛同学用的是小米 10 Pro手机，其配置参数如下：

老牛同学手机配置

选择 Phi-3 微软开源模型

受限于手机 CPU 和内存等硬件配置，我们要选择小语言模型（SLM）。其中，阿里开源了Qwen2-0.5B和Qwen2-1.5B两款小尺寸模型，微软了开源Phi-3 Mini（3.8B）和Phi-3 medium（14B）两款尺寸模型。

由于之前我们在笔记本部署了Qwen2-7B大模型，本次我们就在手机部署Phi-3 Mini模型，顺便也体验一下不同科技公司的大模型产品，其效果可以媲美GPT-3.5大模型：

Phi-3性能评测报告

Qwen2-7B本地部署：Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API 调用和 WebUI 对话机器人

手机配置 Linux 环境（Termux 应用）

小米等安卓手机的基于 Linux 内核的操作系统，但是我们无法像在 Linux 那样执行 Linux 命令，因此我首先得配置一下 Linux 环境。

Termux是一个 Android 的

最低0.47元/天解锁文章

博客等级

码龄18年

109
原创

1718
点赞

2100
收藏

1162
粉丝

关注

私信

热门文章

分类专栏

AI 73篇
Django 1篇
点滴生活 2篇
专业技术 46篇
Dart/Flutter 22篇
Java 13篇
Flex 2篇
数据库 2篇
Maven 4篇
JBPM 1篇
Spring/SpringBoot 3篇
Python 13篇
NoSQL 1篇
消息中间件 1篇
Quartz 1篇

展开全部收起

上一篇：: Stable Diffusion 3 大模型文生图“开源英雄”笔记本部署和使用教程，轻松实现AI绘图自由

下一篇：: 大模型应用研发基础环境配置（Miniconda、Python、Jupyter Lab、Ollama等）

最新评论

vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程
zen_wx: pip install -v -r requirements-cpu.txt --extra-index-url https://download.pytorch.org/whl/cpu 写错了。应该是 requirements/cpu.txt（即：在requirements目录里的cpu.txt文件）
vLLM CPU和GPU模式署和推理 Qwen2 等大语言模型详细教程
zen_wx: 博主写错了。应该是 requirements/cpu.txt（即：在requirements目录里的cpu.txt文件）
Ollama完整教程：本地LLM管理、WebUI对话、Python/Java客户端API应用
程序小丑丷.: org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name 'com.nep.web.Test02': Unsatisfied dependency expressed through field 'ollamaChatClient'; nested exception is org.springframework.beans.factory.NoSuchBeanDefinitionException: No qualifying bean of type 'org.springframework.ai.ollama.OllamaChatClient' available: expected at least 1 bean which qualifies as autowire candidate. Dependency annotations: {@org.springframework.beans.factory.annotation.Autowired(required=true), @org.springframework.beans.factory.annotation.Qualifier("ollamaChatClient")} at org.springframework.beans.factory.annotation.AutowiredAnnotationBeanPostProcessor$AutowiredFieldElement.resolveFieldValue(AutowiredAnnotationBeanPostProcessor.java:659) at org.springframework.beans.factory.annotation.AutowiredAnnotationBeanPostProcessor$AutowiredFieldElement.inject(AutowiredAnnotationBeanPostProcessor.java:639) at org.springframework.beans.factory.annotation.InjectionMetadata.in
基于Qwen2/Lllama3等大模型，部署团队私有化RAG知识库系统的详细教程（Docker+AnythingLLM）
liu3112421: 大佬，给看下，提示这个错误是怎么回事 Failed to save LLM settings: Failed to fetch
ChatTTS 长音频合成和本地部署2种方式，让你的“儿童绘本”发声的实战教程（文末有福利）
qq_45685574: 删除文中的第二步

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。