大模型可以说是近期最热的话题之一,不管是国外的ChatGPT、llama3等,还是国内的文心一言、通义千问等,都可以说是热的发红、红的发紫,秉承着了解的态度,我在github上发现了跟大模型相关的项目,其star高达71.9k,其就是ollama,ollama是什么呢?——一个支持在本地运行大语言模型的工具,兼容 Windows、Linux 和 MacOS 操作系统。使用 Ollama,您仅需一行命令即可启动模型,下面让我们一起来看看这个项目。
安装
其支持Windows、Linux、MaxOS操作系统,怎么下载呢?最简单的办法就是进入官网:
模型下载
因为其是一个工具,所以安装后是没有对应的模型的,为了调用模型则需要下载对应的模型,其支持很多款本地大语言模型,完整版可以访问其[ollama.com/library],下面列举出来几个常用的:
Model | Parameters | Size | Download |
---|---|---|---|
Llama 3 | 8B | 4.7GB | ollama run llama3 |
Llama 3 | 70B | 40GB | ollama run llama3:70b |
Phi 3 Mini | 3.8B | 2.3GB | ollama run phi3 |
Phi 3 Medium | 14B | 7.9GB | ollama run phi3:medium |
Gemma | 2B | 1.4GB | ollama run gemma:2b |
Gemma | 7B | 4.8GB | ollama run gemma:7b |
Mistral | 7B | 4.1GB | ollama run mistral |
Moondream 2 | 1.4B | 829MB | ollama run moondream |
Neural Chat | 7B | 4.1GB | ollama run neural-chat |
Starling | 7B | 4.1GB | ollama run starling-lm |
Code Llama | 7B | 3.8GB | ollama run codellama |
Llama 2 Uncensored | 7B | 3.8GB | ollama run llama2-uncensored |
LLaVA | 7B | 4.5GB | ollama run llava |
Solar | 10.7B | 6.1GB | ollama run solar |
为了尝鲜各个模型,我本地安装了llama3(Meta)和qwen(阿里)两个模型
ollama pull llama3
ollama pull qwen
启动模型开启聊天之旅
下面分别用两个大模型来回答一些问题:
- 你现在是一个程序员,请用js给我写一个冒泡算
- 请用中文回答:先有的鸡还是先有的蛋
llama3尝试
结果正确但是中文支持还是有待提高呀!!!
qwen尝试
编程水平有待提高呀!冒泡都没写对,差评差评!!
终端对话还是有点难搞,还是来个UI吧!
在ollama的github中给推荐了多个UI界面,选来选取选择了一个26K star的库——open-webui,说干就干,安装看一下效果!由于我是本地运行的,所以直接执行如下指令即可安装:([github.com/open-webui/…]
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
运行后访问http://localhost:3000 看看效果吧!其可以随意切换我们安装的本地模型、界面也有一种清新脱俗的感觉,给个好评!
体验心得
自己在工作中是重度的ChatGPT用户,体验了llama3、qwen后,感觉其距离GPT4还是有一段距离,但是本地大模型的优势在于数据安全,且安装在本地后能够避免墙的问题,只能说未来可期,让我们一起期待吧!!!
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓