- 博客(2079)
- 收藏
- 关注
原创 LLM大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!
LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。
2025-03-28 20:04:32
634
1
原创 万字长文!大模型(LLM)推理优化技术总结(非常详细)
大模型训练成本很高,且在推理过程中需要大量的计算资源,为了能够实现大模型应用落地,需解决大模型推理成本、模型响应速度等问题,这就需要对大模型进行推理优化。
2025-12-19 10:54:57
405
原创 从零理解大语言模型(LLM)核心原理
如果零散地看大语言模型的相关描述:有人说大模型是预测下一个词的模型,有人说大模型是将词转化为向量,有人说大模型运用了自注意力机制,还有人指出大模型采用无监督学习和强化学习……
2025-12-19 10:53:43
556
原创 14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星
一位AI从业者在网上分享了自己的学习过程,仅用14天就学完了LLM所需要的核心知识,学习笔记在GitHub上斩获了675+星星,并且还在持续上涨。
2025-12-19 10:53:03
531
原创 一文彻底搞懂大语言模型、智能体与工作流
人工智能正以前所未有的速度渗透到社会经济的各个层面,其发展范式也正从执行特定任务的“狭义AI”向具备更广泛认知与执行能力的“通用AI”迈进。
2025-12-19 10:50:37
421
原创 2025最新AI Agent实战教程,逼自己练完这48页你的智能体就很牛了
在科技飞速发展的当下,AI Agent宛如一颗冉冉升起的新星🌟,在众多领域崭露头角。它最突出的优势,便是能够自动攻克复杂任务,将自动化与智能决策的效率提升到全新高度,让任务自动化处理变得触手可及。
2025-12-18 11:01:23
509
原创 一文搞懂 Function Calling、MCP、A2A 和 Skills
首先是Fuction Calling,他是一种让大模型在推理过程中,能够主动选择并调用外部函数的能力
2025-12-18 11:00:35
805
原创 大模型 RAG 应用全攻略:从文档处理到工具调用的完整指南
本文结合会议分享,从文档处理、嵌入存储、检索优化到上下文管理,全方位拆解 RAG 应用流程,帮你快速掌握实操要点。
2025-12-18 10:58:19
549
原创 生产级别的RAG系统是什么样的?
这个过程揭示了一个需要注意的现实:在RAG项目中,数据预处理往往占据了超过一半的工作量,且需要深厚的领域知识和工程技巧。
2025-12-18 10:57:37
411
原创 AI面试题:如何评估RAG的效果?
最后特别提一句:从定义上,向量库完全不是 RAG 的必需品;从工程上,它只是众多检索策略里的一种,而且经常被滥用。
2025-12-18 10:55:27
780
原创 小白学大模型:构建LLM的关键步骤
随着大规模语言模型(LLM)在性能、成本和应用前景上的快速发展,越来越多的团队开始探索如何自主训练LLM模型。
2025-12-17 10:33:25
212
原创 检索+生成:RAG技术的核心机制及其应用流程解析
RAG是一个强大的功能,能够提高语义搜索效率。它让大语言模型(LLM)在回答问题前,先从外部知识库中检索相关信息,再基于检索结果生成更准确、可靠的回答。
2025-12-17 10:32:42
285
原创 小白学大模型:从零实现 LLM语言模型
在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。
2025-12-17 10:32:09
311
原创 亚历山大图书馆的灰烬与重生:为什么RAG(检索增强)是你大脑的唯一外挂?
对于AI来说,这些“私有知识”就像是当年的亚历山大图书馆,虽然存在,但不可见。 如果不解决这个问题,AI永远只能是你泛泛之交的网友,成不了你的灵魂伴侣或核心幕僚。
2025-12-17 10:31:18
395
原创 炸裂!谷歌AI Agent白皮书中文版横空出世,在AI教材直接“封神”
这份白皮书系统性地讲解生成式AI Agent的原理、架构和应用实践,为开发者提供构建更强大、更灵活AI系统的指导。
2025-12-17 10:30:38
392
原创 【项目复现上新】LLaMA Factory 微调实践:从零构建苏东坡角色扮演大模型 | 附Lab4AI平台一键复现指南
这是微调后大模型的回答,随着人工智能的发展,虚拟角色不再只是冰冷的对话机器,而是可以承载历史人物气质、知识体系乃至精神风貌的数字化身。
2025-12-16 10:21:19
1056
原创 小白学大模型:从头搭建Qwen3(MoE、GQA、RoPE 和 Multi-Head Attention)
在这篇博客文章中,我们将从头开始构建一个 0.8 亿参数、包含两个专家层的 Qwen 3 MoE 模型。
2025-12-16 10:20:44
637
原创 GitHub必备收藏:这个项目汇集了所有你需要的LLM应用实例
项目不仅提供了丰富的代码示例,还包含详细的文档说明和安装指南,让开发者能够快速理解和部署这些应用。对于想要深入学习LLM应用开发的开发者来说,这是一个不可多得的学习资源。
2025-12-16 10:19:54
725
原创 技术干货丨AI 大模型微调到底是什么?一篇通俗文帮你弄明白
微调就是在已经训练好的大模型基础上,用你自己的数据继续训练,让模型更符合你的特定需求。
2025-12-16 10:18:32
908
原创 轻松搞定百个大模型微调!LLaMA-Factory:你的AI模型量产神器
今天,我们要介绍一个革命性的开源项目——LLaMA-Factory。它能够让你统一、高效地微调100+个大语言模型与视觉语言模型,堪称ACL 2024的明星工具!
2025-12-15 10:10:18
695
原创 LLaMA-Factory:打造属于你的大模型指令微调工厂
大语言模型(LLM, Large Language Model)的发展势如破竹。从最初的 GPT、BERT 到如今的 LLaMA、Qwen、GLM 等,开源与闭源的模型体系不断涌现。
2025-12-15 10:09:44
737
原创 2025 智能体开发路线图:从入门到精通,一篇读懂AI Agent
今天,我们将通过一份2025年AI Agent开发路线图,全面解析Agent开发领域的核心技术栈和发展路径。
2025-12-15 10:08:32
870
原创 别再瞎学大模型了,这份GitHub神级课程火爆全网
这个项目真心不错,结构化得特别好,把复杂的 LLM 领域拆解成了三个清晰的部分,对想系统学习的同学来说,简直是福音。
2025-12-15 10:07:50
1030
原创 一张图搞明白“提示词”、“Agent”、“大模型”、“MCP”、“工具”之间的关系
提示词激发意图,大模型提供认知,智能体负责决策与调度,MCP标准化连接,工具执行现实操作,五者协同构成智能系统的完整链路,让AI既能“思考”,也能“行动”。
2025-12-14 10:45:00
1438
1
原创 【代码级实战】Agentic RAG 架构的基本原理与应用入门
为了帮助大家更好地理解 Agentic RAG,我将首先分别介绍 RAG 和 AI Agent 架构的独立工作原理,然后再将它们结合起来,展示如何最终形成 Agentic RAG。
2025-12-14 08:45:00
1159
原创 小白学大模型:从零实现 LLM语言模型
在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。
2025-12-13 10:45:00
973
原创 小白6个月速成:大模型学习实战攻略
这是一个为小白设计的、为期6个月的大模型学习计划。这个计划注重循序渐进,强调基础先行,再逐步深入核心概念和实践。
2025-12-13 08:15:00
917
原创 RAG、微调、提示工程:三种让AI变聪明的方法,该怎么选?
RAG(检索增强生成)、Fine-tuning(微调)和Prompt Engineering(提示工程)。今天,我们就来拆解这三种方法,看看它们各自的魔力、适用场景,以及该如何选择。
2025-12-12 10:45:06
767
原创 「包教会」手把手教你微调大模型
本文将重点聚焦于最成熟的微调技术之一——指令监督微调(SFT)。以 LLaMA Factory 为载体,系统性地演示和解析一套完整的微调工作流程。
2025-12-12 10:44:21
865
原创 手把手教你快速玩转LLaMA-Factory:大模型微调入门级教程
对于希望尝试大模型训练的同学来说,从 LLaMA-Factory 入手是一个非常不错的选择!在实际工作中,也经常用到 LLaMA-Factory 进行模型训练。用得越多,越能体会到它的便捷与高效。
2025-12-12 10:40:26
771
原创 揭秘 AI 大模型背后的“梦之队”:LLM、LangChain、Embedding 与向量数据库的爱恨情仇
今天我就脱下工程师的格子衫,换上作家的笔触,为你抽丝剥茧,用最通俗易懂的语言,讲清楚这支 AI 应用背后的“梦之队”是如何协同作战的。
2025-12-11 10:08:10
977
原创 【连载】零基础跟我学做AI Agent(第4课:用Autogen开发一个学霸Agent)
本篇做一个具有两个角色的应用,一个角色擅长解数学题,另一个角色专注于化学知识解答,那推而广之,我们就可以做一个所有学科都优秀的Agent应用了。
2025-12-11 10:07:16
588
原创 【连载】零基础跟我学做AI Agent(第3课:用LangChain开发一个做题Agent)
今天讲第3课,用一个做Agent的经典框架——LangChain,开发一个做数学题的Agent。
2025-12-11 10:06:16
524
原创 【连载】零基础跟我学做AI Agent(第2课:用CrewAI配置一个软件虚拟团队)
本例中Agent实现的目标是配置一个虚拟开发团队,这个团队中有资深程序员,还有测试工程师,两者协作完成一个具体的开发任务。
2025-12-11 10:05:26
991
原创 【连载】零基础跟我学做AI Agent(第1课:环境安装)
从今天开始,作者介绍一系列AI Agent(智能体)的开发或部署。需要的基础只是要对Python有个大概的了解,几乎是从0开始实践。涉及到的代码都会比较简单,一般不会超过50行。
2025-12-11 10:04:38
690
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅