自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(669)
  • 收藏
  • 关注

原创 超低配置完成 GLM-4-9B本地部署,支持 Ollama(附教程)

GLM-4-9B 是智谱 AI 推出的预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中, GLM-4-9B 在各项能力上均表现出卓越的能力。

2025-03-15 11:30:00 666

原创 本地知识库入门实战:27K star项目--Langchain-Chatchat!基于LLM构建本地知识库(附教程)

今天我们分享一个开源项目,帮助你快速构建基于Langchain 和LLM 的本地知识库问答,在GitHub已经获得27K star,它就是:Langchain-Chatchat

2025-03-15 09:45:00 263

原创 万字长文深度解析规划框架:HuggingGPT(附教程)

HuggingGPT是一个结合了ChatGPT和Hugging Face平台上的各种专家模型,以解决复杂的AI任务,可以认为他是一种结合任务规划和工具调用两种Agent工作流的框架。

2025-03-14 11:33:19 161

原创 有手就行大模型部署教程:怎样在个人电脑上部署盘古大模型

本文旨在探讨这一过程,为读者提供一个从理论到实践的指南,帮助大家理解大模型部署的基本原理,以及如何克服资源限制,实现个人电脑上的初步应用尝试。

2025-03-14 11:32:09 309

原创 简单!使用Ollama 本地CPU部署开源大模型(附教程)

Ollama可以在本地CPU非常方便地部署许多开源的大模型。如 Facebook的llama3, 谷歌的gemma, 微软的phi3,阿里的qwen2 等模型。

2025-03-14 11:31:00 332

原创 大模型理论基础(so-large-lm)+《开源大模型食用指南》助你速通大模型!(文档分享)

在当前信息时代,大型语言模型(Large Language Models,LLMs)的发展速度和影响力日益显著。随着技术进步,我们见证了从基本的Transformer架构到更为复杂和高效的模型架构的演进,如Mixture of Experts (MOE) 和Retrieval-Augmented Generation (RAG)。这些进步不仅推动了人工智能领域的边界,也对理解和应用这些技术提出了新的要求。

2025-03-14 11:29:59 368

原创 大模型开源项目:Ollama让你的电脑也可以轻松运行大模型(附教程)

本地运行这些模型却一直是一项艰巨的任务。运行这些模型需要大量的计算资源,而且数据存储需求往往超过了一般个人设备所能提供的。

2025-03-13 16:51:23 514

原创 本地化部署:RAG流程优化(微调)的4个基本策略(附教程)

在本文中,我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。

2025-03-13 16:50:22 626

原创 常见本地大模型个人知识库工具部署、微调及对比选型(附教程)

近年来,大模型在AI领域崭露头角,成为技术创新的重要驱动力。从AlphaGo的胜利到GPT系列的推出,大模型展现出了强大的语言生成、理解和多任务处理能力,预示着智能化转型的新阶段。然而,要将大模型的潜力转化为实际生产力,需要克服理论到实践的鸿沟,实现从实验室到现实世界的落地应用。

2025-03-13 16:49:18 670

原创 大模型本地化部署:Ollama+MaxKB 部署本地知识库(附教程)

大模型本地化部署:Ollama+MaxKB 部署本地知识库(附教程)

2025-03-13 16:46:34 739

原创 【大模型部署】本地部署AI大模型三步走(Ollama+通义千问)

先给大家介绍一下今天的主角Ollama:Ollama是一个强大的工具,它能在本地轻松部署和运行大型语言模型,如Gemma, 助你轻松跨过这道门槛。

2025-03-13 16:45:24 908

原创 什么是AI大模型?(超详细)大模型从入门到精通,看这一篇就够了(附PDF)

大模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。

2025-03-12 10:56:45 583

原创 《开源大模型食用指南》已发布,助你速通大模型!(文档分享)

《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

2025-03-12 10:55:31 985

原创 LLM大模型推理框架终极抉择:Ollama与vLLM该怎么选?(附教程)

近年来,随着大语言模型(Large Language Model)应用的火热,越来越多的企业和个人开发者都希望能够在本地或服务器上方便地部署自己的大模型推理服务。无论是进行自然语言处理(NLP)任务,还是用来提供对话机器人服务,或是构建智能客服与搜索引擎,都离不开一个高效、易用、可扩展的大模型推理框架。

2025-03-12 10:54:28 962

原创 DeepSeek-R1大模型本地部署,保姆级教程(附教程)

本文将介绍如何在自己的电脑上本地部署DeepSeek大模型,无需登录DeepSeek官方网站与软件即可使用。本文提及的所有软件均已打包,文末有获取方式。

2025-03-12 10:53:29 1033

原创 Windows安装Ollama并通过内网穿透远程访问本地qwen大语言模型实操(附教程)

本文将带领您了解如何迅速在Windows平台上部署Ollama,这是一个开源的大语言模型(LLM)运行工具,以及如何通过Open WebUI和cpolar内网穿透技术,让您在任何地方都能访问您本地部署的AI语言模型,如llama2和千文qwen。

2025-03-12 10:52:39 1159

原创 4个步骤,轻松在本地部署DeepSeek-R1大模型(保姆级教程)

DeepSeek 太火了。火到直接出天际了,火到最近不但海量的涌入使用,更招致黑客的攻击。

2025-03-10 10:24:24 723

原创 用LM Studio工具部署本地AI大模型,真的太省事了!(普通人也能用)

今天先介绍下普通人如何部署自己的本地大模型。_你可能会问:为什么要自己部署本地大模型?

2025-03-10 10:23:22 1132 1

原创 小白都能看懂,deepseek本地部署教程(附教程)

今天给大家分享deepseek的本地部署教程,有需要的朋友可以留言交,可以提供本地部署及服务器资源监控。 

2025-03-10 10:22:22 855

原创 RAG+AI工作流+Agent:全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM

MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。

2025-03-10 10:21:19 739

原创 【AI大模型项目实战】健康医疗大模型,开源了!

基于主动健康的主动性、预防性、精确性、个性化、共建共享、自律性六大特征,华南理工大学未来技术学院-广东省数字孪生人重点实验室开源了中文领域生活空间主动健康大模型基座ProactiveHealthGPT。

2025-03-08 15:30:51 830

原创 千问发布QwQ 32B对比671B形成视觉冲击,暗含“小体积大能量“的颠覆感

阿里云通义千问官方宣布推出最新推理模型QwQ-32B,这一模型仅有32B参数,但在效果上与拥有671B参数的DeepSeek-R1相媲美。如果你自己部署DeepSeek-R1但资源不够的话,又多了一个新的选择。

2025-03-08 15:25:31 1024

原创 《大语言模型》中文书课件正式上线!

本书由中国人民大学师生联手打造,由赵鑫教授和文继荣教授领衔,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。

2025-03-07 16:23:16 767

原创 开发者速藏!浙大开源大模型「从入门到调优」指南

浙江大学高能开源! 由毛玉仁、高云君等教授团队编写的《大模型基础》教材,以“月度更新”的活态知识库形式免费开放,成为开发者入门大模型的“宝藏指南”。本文将带你全面解析这本开源教材的核心价值与学习路径。

2025-03-07 16:20:33 764

原创 最新DeepSeek教程:DeepSeek从入门到精通(觉醒学院版)

在这个人工智能技术飞速发展的时代,如何让AI真正成为提升效率、解决问题的伙伴,而非仅仅是“听说过”的科技概念?答案或许就藏在今天这篇文章里——《DeepSeek从入门到精通》。

2025-03-06 21:40:13 597

原创 DeepSeek本地部署+UI可视化+本地知识库训练AI之新手教程,建议收藏!

在信息爆炸时代,真正的竞争力不在于掌握多少数据,而在于如何让AI将碎片化知识转化为可执行的智慧。以下是通过DeepSeek构建专属知识库的详细步骤。

2025-03-06 21:38:21 639

原创 AI大模型:从概念到应用,普通人如何上手?

AI大模型:从概念到应用,普通人如何上手?

2025-03-05 14:50:04 710

原创 Hugging Face开源超大规模GPU训练实战指南!!3万字!!

Hugging Face 官方最近发布了一个3万字的大模型电子书,貌似还没几人提到,我简单介绍下。

2025-03-05 14:41:42 679

原创 HuggingFace发布LLM超大规模实战手册 | 200页报告解读 | 4000个Scaling实验 | 激活值重计算

2月19日,Hugging Face 发布了一本关于如何在 GPU 集群上训练大语言模型的《超大规模训练手册》。这本手册耗时 6 个月完成,在多达 512 个 GPU 上进行了超过 4000 次的 scaling 实验。内容涵盖了从基础原理到实际操作的方方面面,对于想要深入了解大模型训练的人来说,这是一份极具价值的参考资料。

2025-03-05 14:38:57 873

原创 Agent实战:基于大模型的Agent技术框架开发实战

随着人工智能的发展,Agent在互联网生态中的重要性日益凸显。它们不仅能够自主执行复杂任务,还可以智能地处理和消费数据,极大提升了效率。Agent的崛起正在重塑我们与信息、服务之间的关系,从数据分析到自动化流程,它们都扮演着不可或缺的角色。

2025-03-04 10:50:20 298

原创 2025年,AI Agent干货资料、论文综述都在这了

最近相信大家都被Deepseek刷屏了,但训练顶尖模型却只是少数人的战场,真正的产业革命正逐渐转向 AI Agent(智能体) 的探索——让LLM从“对话工具”蜕变为“行动者”,通过自主决策与工具调用,真正落地于复杂场景。

2025-03-04 10:48:18 796

原创 针对RAG系统的嵌入模型微调实践指南(附教程)

本文将带你了解如何设置并微调嵌入模型,以提升 RAG(检索增强生成)系统中检索器的精度。同时,你将学习如何使用 LangSmith 进行实时监控,并利用 RAGAS 指标对系统性能进行系统评估。

2025-03-04 10:44:44 842

原创 GitHub趋势榜新宠!15k Star的LLM应用开发圣经——awesome-llm-apps深度解析

大家好!这几天DeepSeek 火爆了,学习LLM 应用也在GitHub 火爆了,这个项目在GitHub 一天新增1000+Stars。

2025-03-03 11:25:36 1042

原创 普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

GitHub上一个开源项目彻底打破门槛:只需3块钱、2小时,普通人也能从零训练自己的语言模型!项目“MiniMind”上线即爆火,狂揽8.9k星标,技术圈直呼:“这才是AI民主化的未来!”

2025-03-03 11:22:53 596

原创 错过血亏!GitHub万星AI课中文版:21天从Prompt到RAG实战,小白秒变大神

大家好!最近大家在学习LLM 热情爆棚,在群里我看到小伙伴一直在提问,今天介绍一个GitHub 开源的免费学习项目—— 手把手教你玩转ChatGPT、DALL·E,轻松构建智能应用!

2025-03-03 11:21:28 568

原创 小白入门大模型:LangChain(附教程)

Langchain是一个语言模型的开发框架,主要是利用大型LLMs的强大得few-shot以及zero-shot泛化能力作为基础,以Prompt控制为核心基础,让开发者可以根据需求,往上快速堆叠应用,简单来说:LangChain 是基于提示词工程(Prompt Engineering),提供一个桥接大型语言模型(LLMs)以及实际应用App的胶水层框架。

2025-02-27 11:14:10 1002

原创 用AI打造你的私人知识助理,律师、医生、科研人员的必备神器!

今天我们要聊一个超级实用的话题——如何利用AI技术,为知识密集型从业者(比如律师、医生、科研人员)打造一个专属的“私人知识助理”。这个工具不仅能帮你快速检索海量专业文献,还能实时翻译跨语种内容,并且监测行业政策更新。听起来是不是很厉害?别急,接下来我们就一步步教你如何实现!

2025-02-27 11:12:59 759

原创 Deepseek + anythingLLM:如何用10元构建一个强大的AI知识库?

Deepseek + anythingLLM:如何用10元构建一个强大的AI知识库?

2025-02-27 11:11:47 867

原创 零代码玩转百模!LLaMA-Factory:大模型微调从未如此简单

还在为大模型微调烧显卡发愁?北航团队开源的 LLaMA-Factory 重新定义了大模型定制姿势!这个 GitHub 爆火项目已斩获 32.1K+ Stars,堪称大模型界的「瑞士军刀」🔧

2025-02-26 19:41:59 703

原创 5分钟打造专属知识库!DeepSeek+Ollama+AnythingLLM 本地私有部署指南

在如今信息爆炸的时代,拥有一个专属知识库,能让我们快速获取所需信息,极大提升工作与学习效率。而实现本地私有部署,更能保障数据安全与隐私。接下来,我将带你了解如何仅用 5 分钟,通过 DeepSeek、Ollama 和 AnythingLLM 完成这一操作。

2025-02-26 19:38:14 1102

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除