大语言模型-CSDN博客

各位读者朋友们，相信你一定还记得，在各大平台AI大模型图书推荐榜单中，一书始终位居排行榜前列，在2023年末那个时间点，这本书是少有的把大模型相关技术系统汇总整理，既有理论又有实践的。时隔不到两年，大语言模型领域的发展可谓突飞猛进，大语言模型的能力在多个方面实现了显著突破，在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。

2025-04-27 10:18:39 675

原创程序员必备：使用Cursor+MCP 提高开发效率+避坑指南

AI正在深刻改变着软件开发的方式。在传统的开发模式中，程序员需要记忆大量的语法规则、API文档和最佳实践，这不仅增加了学习成本，还限制了开发效率。

2025-04-25 09:20:33 876

原创从零到一构建Agent系统：四大模块 + 框架生态详解

在大模型持续进化的今天，Agent 成为很多人眼中的“超级助手”，从代码编写到数据分析、从网页问答到知识检索，它无所不能。但如果你尝试亲自“造一个Agent”

2025-04-25 09:19:20 812

原创 NodeRAG：以图结构革新检索增强生成

在众多RAG方法中，NodeRAG以其独特的图结构框架脱颖而出。NodeRAG通过异构图结构和先进的检索机制，为LLM提供更精准、更高效的外部知识支持。本文将深入介绍NodeRAG的核心特性、优势及其在多个领域的卓越表现。

2025-04-24 09:43:35 636

原创 RAG 作者：RAG 已死，RAG 万岁！

每隔几个月，人工智能领域就会经历类似的模式。一个具有更大上下文窗口的新模型问世，社交媒体上便会充斥着“RAG 已死”的宣言。Meta 最近的突破再次引发了这场讨论——Llama 4 Scout 惊人的 1000 万（理论上）token 上下文窗口代表着一次真正的飞跃。

2025-04-24 09:30:48 583

原创大模型是怎么“思考”的？五分钟看懂大模型的底层逻辑！

近年来，ChatGPT 的爆火让“大语言模型”（LLM）走进了大众视野。我们每天都在用它们聊天、写作、写代码，但你是否真正了解它们是怎么工作的？本文系统梳理了大语言模型的原理、训练方式及其实际应用。

2025-04-23 09:25:40 633

原创在CPU上运行100B模型只需4MB内存！微软BitNet掀了英伟达的桌子！

在CPU上运行100B模型只需4MB内存！微软BitNet掀了英伟达的桌子！

2025-04-23 09:23:59 776

原创大模型开发：掌握LLM的关键技能，这本指南不可错过（附PDF）

《Hands-On Large Language Models》（中文版预计 3 月底上市），由 Jay Alammar 和 Maarten Grootendorst 倾力打造，为你深入解读大模型的技术核心，让看似复杂的技术变得通俗易懂、触手可及！

2025-04-22 09:46:53 937

原创混合专家模型 (MoE) 到底是什么？看完这篇，你也能讲明白！

如果你还不知道什么是 MoE ，那就码住今天的文章吧！我们将图解 MoE，用 50 张图细致地探索这一重要组件——混合专家模型（MoE）。

2025-04-22 09:40:06 1091

原创这书太绝了！几乎把大模型讲得透透的！

一本注重实战、内容透彻的 LLM 入门书。作者手把手带你亲手构建、训练、微调一个属于自己的大模型。没有比这本书更保姆级的了。

2025-04-21 14:27:10 154

原创权威力作升级！《大语言模型：从理论到实践》第二版（预览版）重磅来袭！

大家好！👋 在人工智能浪潮之巅，大语言模型（LLM）无疑是最耀眼的明星 ✨。从 ChatGPT 的惊艳问世，到 LLaMA、Qwen、DeepSeek 等模型的持续迭代，它们强大的语言理解、生成和推理能力正在深刻改变着我们的世界。

2025-04-21 14:01:24 1177

原创 FastGPT、Dify和Coze，三大智能体开发平台详细对比(附教程)

本文将从功能实现、用户体验、适用场景、以及性能表现等多个维度，深入分析这三款 RAG 工具的核心优势与潜在不足，为有需求的读者提供客观的参考建议，帮助大家选择最适合自己业务需求的解决方案。

2025-04-18 15:27:52 693

原创「大模型学习黄金书单」认真啃完这些书，一条线速通大模型（附PDF）

这几本书是一路上踩坑总结的「大模型学习黄金书单」，从编程入门，到深度学习基础，再到 LLM 原理、落地应用，完整一条线，不忽悠、不烧香，适合想认真搞事的朋友！

2025-04-18 15:12:26 1221

原创大模型书籍推荐：AI原生应用开发：提示工程原理与实战（附PDF）

《AI原生应用开发：提示工程原理与实战》是一本由人民邮电出版社权威出版，专门针对正在探索如何利用大模型做应用场景落地的人群，如研发工程师、产品经理、技术经理等。它站应用落地视角让你理解大模型是什么，能干什么，如何落地。

2025-04-17 11:09:27 819

原创《大模型应用开发极简入门：基于GPT-4和ChatGPT》PDF下载

《大模型应用开发极简入门：基于GPT-4和ChatGPT》PDF下载

2025-04-17 10:39:02 590

原创揭秘大模型的训练方法：使用PyTorch进行超大规模深度学习模型训练

我相信我们每个人都已经快要被 LLM（大语言模型）研究界的节奏“卷”麻了。几乎每天都会有一款新的 SOTA（最先进）模型横空出世，打破现有基准。

2025-04-17 10:32:22 803

原创大模型书籍丨2025爆火全网的LLM大模型黑书！入门大模型大家全都在学~

今天给大家推荐一本4月份才新出的大型语言模型（LLM）的权威教程《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》！Google工程总监Antonio Gulli作序，一堆大佬推荐！这含金量不用多说，不多bb开始介绍！

2025-04-16 11:19:54 620

原创 AI大模型应用系列：从MLOps到LLMOps（附教程）

LLMOps 通过结合“终身”学习扩展了 MLOps，使机器学习模型能够随着时间的推移不断地从新数据中学习和改进，从而使数据快速变化的应用程序受益。

2025-04-16 11:18:39 838

原创大模型教程丨GitHub16.6K星标，吴恩达的【大模型入门教程】究竟有什么魔力（附PDF）

今天给小伙伴们整理的这份大模型入门教程是由斯坦福大学的吴恩达老师和Open AI官方联合推出的大模型系列教程，从大模型时代开发者的基础技能出发，深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。非常适用于开发者学习以开启基于 LLM 实际搭建应用程序之路。

2025-04-16 10:37:44 927

原创大模型书籍分享丨《掌握大语言模型》附pdf书籍

《掌握大语言模型》这本书是自然语言处理（NLP）和大语言模型（LLMs）领域的一本重要参考书籍，适合那些希望深入了解和应用这些强大语言模型的朋友们。该书不仅仅是理论探讨，而是通过实际操作手把手教读者如何构建和应用这些强大的语言模型。

2025-04-15 10:30:38 808

原创（中英双语）从零开始构建大模型：GitHub超44K Star的大模型教程（送PDF）

2025 年以来，AI 大模型领域持续火热，从 DeepSeek、GPT-4、Claude 3 到 Gemini 2.0 等等，各家模型参数动辄千亿级，能力日新月异。

2025-04-15 10:13:17 1261

原创大模型新书丨从零开始构建大模型：GitHub超44K Star的大模型教程

对GPT大模型感兴趣的有福了！这本书的名字叫《Build a Large Language Model (From Scratch)》也就是从零开始构建大语言模型！

2025-04-15 10:11:55 751

原创 LLM终极指南《LLM 应用开发实践笔记》PDF免费分享

大语言模型（Large Language Model）是一种基于深度学习技术的自然语言处理通用模型，它可以通过学习大规模文本数据的模式和规律，从而实现对自然语言的理解和生成。通用型：在广泛的任务中表现出色，而不是针对一项特定任务，规模大：参数数量在数十亿或更多数量级的深度学习模型。

2025-04-14 10:12:03 813

原创使用KAG+多模态RAG+智能体建造强大的AI推理机器人

随着 AI 技术蓬勃发展，RAG 正成为游戏规则改变者，迅速成为问题解决和领域应用的合作伙伴，这正是 RAG 的独特之处。

2025-04-14 10:10:18 621

原创一文讲透MCP的原理及实践

MCP (Model Context Protocol) 代表了 AI 与外部工具和数据交互的标准建立。通过本文，我们可以了解到MCP的本质、价值、使用与开发。

2025-04-14 10:05:23 904

原创强烈推荐！这本大语言模型 “宝典” 带你从入门到精通（含301页完整PDF和8章完整课件下载）

在大语言模型（LLM）飞速发展的当下，想要深入了解却不知从何入手？别担心，《大规模语言模型：从理论到实践》这本书就是你的最佳指南！

2025-04-12 09:43:08 805

原创大模型新书丨《大规模语言模型：从理论到实践》（附PDF）

大模型新书丨《大规模语言模型：从理论到实践》（附PDF）

2025-04-12 09:39:46 793

原创 6 个 GitHub 上狂飙的 AI 教程（附教程）

6 个 GitHub 上狂飙的 AI 教程（附教程）

2025-04-12 09:30:23 685

原创斩获 3W 星！最近爆火的 MCP 一网打尽

arxiv-mcp-server 这个 MCP Server，专为 arXiv 学术论文库设计，允许 AI 模型通过编程接口搜索论文、下载内容并进行深度分析（如摘要提炼、方法评估和结果解读），同时支持本地存储以加速访问

2025-04-12 09:24:35 836

空空如也

空空如也