AI大模型..-CSDN博客

原创 LLM大模型学习文档+教程+PDF书籍+系统学习路线，一套全拿到！

LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

2025-03-28 20:04:32 550

原创由Hugging Face核心团队亲自操刀，堪称Transformer技术领域的“圣经级“教材！

这本由Hugging Face Transformers 的创建者 Lewis Tunstall、Leandro von Werra 和 Thomas Wolf合著的一本关于自然语言处理（NLP）和Transformers模型的书籍，对。第9章“处理少量或无标签”探讨在缺乏大量标签数据的情况下，提升模型性能的方法。第11章“未来方向”探讨Transformer面临的挑战，以及该领域研究中一些令人兴奋的新方向。第6章“摘要”深入钻研文本摘要这一复杂的序列到序列任务，并探讨用于该任务的各项指标。

2025-06-10 11:19:59 91

原创迄今为止关于构建 LLM 应用程序的最全面的教科书！LlamaIndex联合创始人兼首席执行官给予高度评价！

如果你想构建能在当今实际场景中发挥作用的大语言模型（LLM）产品，这本书就很合适。它探讨了各种方法，以增强准确性、可靠性和可扩展性，将“基础”LLM 应用于特定任务。

2025-06-10 11:17:36 72

原创浙大《大模型基础》PDF遭疯传，网友：比李沐还细！

最近看到浙大的这本大模型教程，感觉做得挺不错的，系统地讲了从传统语言模型到大模型架构演化、Prompt 工程、参数高效微调、模型编辑、RAG 这些核心技术，适合想系统学习 LLM 的人。

2025-06-09 15:02:11 666

原创微软上架了免费的生成式AI入门课程——Generative AI for Beginners

微软上架了免费的生成式AI入门课程——Generative AI for Beginners。这套课程主打“新手友好”，不需要太深的技术背景，带你从零开始，一步步搞懂生成式AI应用的原理。

2025-06-09 15:00:48 395

原创 AI Agents for Beginners 课程之 AI Agent及使用场景简介

AI Agents for Beginners 课程之 AI Agent及使用场景简介

2025-06-08 12:00:00 565

原创大模型时代，智能体崛起：从技术解构到工程落地的全栈指南 ——《大模型技术30讲》

在当今人工智能快速发展的浪潮中，大模型技术正逐渐从学术研究的前沿领域转变为推动产业变革的核心动力。

2025-06-08 09:30:00 877

原创大模型微调系列教程(四)——LLaMA Factory微调Qwen3-8B

LLaMA Factory 是一个简单易用且高效的大型语言模型训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调。并且更新及时，是微调的好工具。

2025-06-07 10:00:00 782

原创大模型微调系列教程(三)——如何构建微调数据集？

数据清洗和预处理是将原始数据转化为结构化、高质量、适合模型训练的格式的关键步骤，下面介绍一些常见的清洗技术。

2025-06-07 08:45:00 894

原创大模型微调系列教程(二)——微调技术与开源微调工具推荐

开源微调工具的涌现极大地推动了LLM定制化的普及和发展。降低了技术门槛，使得更广泛的用户和组织能够根据自身需求调整和优化强大的预训练模型，从而催生了大量的创新应用。

2025-06-06 14:33:28 926

原创大模型微调系列教程(一)——为什么要微调？(漫画讲解)

大模型微调（Fine-tuning Large Models）是一种机器学习技术，指的是在一个已经预先训练好的大型模型（Pre-trained Large Model）的基础上，利用你自己的、通常规模更小且更具针对性的数据集，对模型进行进一步的训练，以使其更好地适应特定任务、领域或风格。

2025-06-06 14:28:56 898

原创 LangChain4j 初识，想使用Java开发AI应用？

LangChain4j 是一个基于 Java 的开源框架，用于开发人工智能驱动的应用程序，尤其是涉及大语言模型（LLM）交互的场景。

2025-06-06 13:53:34 902

原创记录第一次公司内部分享：如何基于大模型搭建企业+AI业务

下面主要讲了需要的AI 技术储备，可以让团队快速建立AI方面的技术认知，以及如何将业务+AI LLM 结合起来的思路，更多细节没有在本文里面去表现。

2025-06-05 15:51:24 997

原创 2024-2025年中国AI大模型市场现状及发展趋势研究报告｜附77页PDF文件下载

中国积极布局、大力支持AI大模型发展，相关科技公司积极研发国产大模型，同时不断涌现出大量大模型科技公司。

2025-06-05 15:22:04 1003

原创报告下载丨2025年大模型应用：从提示工程到AI智能体报告

报告分析了提示工程在大模型应用中的作用和局限性，以及AI智能体的发展前景和挑战。

2025-06-04 14:27:01 525

原创报告下载丨中国信通院-2025年大模型平台落地实践研究报告

中国信通院发布的《2025年大模型平台落地实践研究报告》围绕大模型平台落地展开。报告先梳理其发展背景、历程和现状，接着提出落地策略与路径，涵盖评估诊断、方案制定等步骤，还分析模型开发、服务、应用等关键能力的建设要点。

2025-06-04 14:25:11 292

原创 LLM大型语言模型脑图（三）应用篇

基于大模型的应用平台是连接用户需求与模型能力的桥梁，旨在通过集成化的开发环境和工具链支持快速构建AI应用。

2025-06-04 08:45:00 1019

原创 LLM大型语言模型脑图（二）开发篇

基于大模型的开发是一个快速发展的领域，涵盖从需求分析到部署优化的完整流程。开发框架如Hugging Face、LangChain等提供了强大的工具支持，而开发方向则覆盖了对话系统、代码辅助、多模态应用等多个领域。未来，随着模型性能提升和计算成本降低，LLM将在更多行业中实现深度应用。开发者需要关注技术迭代，结合具体场景优化模型与系统，以实现高效、可靠的解决方案。

2025-06-03 15:40:34 706

原创 LLM大型语言模型脑图（一）基础技术篇

目前大模型处于爆火状态，大家对LLM基础技术还是比较感兴趣，故根据我现在已有的知识，给大家整理一个脑图；主要梳理了基础技术篇的脑图，后续文章会继续给出开发、应用偏的脑图；辅助小伙伴们对LLM认知。

2025-06-03 15:36:18 932

原创 DeepSeek R1 + Cherry Studio 打造本地 AI 知识库：真的太香了！

今天继续聊聊 DeepSeek R1，不过这次我们要搭配 Cherry Studio 来打造一个本地知识库，让 AI 更懂你、更贴合你的需求。

2025-06-03 15:30:39 607

原创 Function Calling 执行流程和历史消息结构

在 function calling（工具调用）的场景中，传递给大语言模型（LLM）的历史消息需要包含完整的对话上下文，包括用户输入、模型生成的工具调用请求（tool_calls），以及工具执行后的返回结果。

2025-05-29 15:56:41 917

原创打造本地私有化知识库系统：在家轻松部署Dify、FastGPT（附教程）

大家好，今天我要和大家分享一个本地知识库DIY项目：如何在家搭建自己的基于AI大模型的知识库系统。听起来是不是有点高大上？别担心，跟着我一步步来，保证你也能轻松上手！

2025-05-28 15:41:49 614

原创本地知识库实战！借助RAGFlow搭建医院医疗问诊助手！(附数据集+代码)

使用Huggingface上的开源医疗数据集，借助 RAGFlow 搭建自己的本地医疗问诊助手。（文末附数据集+代码）

2025-05-28 15:41:10 985

原创 Win电脑使用Ollama与Open Web UI搭建本地大模型运行工具（附教程）

本文主要介绍如何在Windows系统快速部署Ollama开源大语言模型运行工具，并安装Open WebUI结合cpolar内网穿透软件，实现在公网环境也能访问你在本地内网搭建的llama2、千文qwen等大语言模型运行环境。

2025-05-27 15:35:20 911

原创什么是AI大模型？（超详细）大模型从入门到精通，看这一篇就够了（附教程）

大模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能，能够处理更加复杂的任务和数据。

2025-05-27 15:33:55 608

原创大模型本地部署：LLM 利器 Ollama 架构和对话处理流程解析（附教程）

本文将解析 Ollama 的整体架构，并详细讲解用户在与 Ollama 进行对话时的具体处理流程。

2025-05-27 15:33:18 571

原创 DeepSeek带火AI大模型岗！急招岗年薪百万，人才缺口将达400万（附大模型教程）

正值年后跳槽高峰期，近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏，阅读量上亿。

2025-05-26 10:31:03 704

原创 2025年最火IT岗——AI大模型开发工程师，月薪25k都算低的

2025年，AI大模型开发工程师无疑成为了IT行业中最炙手可热的岗位之一，这不仅是市场需求的直接反映，更是AI技术发展的必然结果。

2025-05-26 10:29:56 629

原创 10分钟搞定，DeepSeek+Ollama+MaxKB 本地部署完全指南，打造专属知识库（附教程）

今天，我们就来详细介绍如何在 10 分钟内完成 DeepSeek、Ollama 和 maxkb 的本地部署，搭建属于你的智能知识问答系统。

2025-05-26 10:28:50 720

原创本地大模型+知识库（RAG）介绍，一文全讲解（附教程）

本文介绍一种可部署于本地的大模型应用：“本地大模型+知识库（RAG，检索增强生成）”，有助于解决上述的问题。

2025-05-25 17:15:00 814

原创你真的懂 LLM 吗？揭秘大语言模型的核心奥秘（附大模型教程）

AI 的发展经历了多个阶段，从最早的基于规则的专家系统，到如今的深度学习和神经网络驱动的智能系统，使得 AI 具备了更强的学习能力和泛化能力。

2025-05-25 13:15:00 529

原创 2025零基础人员如何入门AI？这是一份给你的学习路径指南（附教程）

当下AI已然成了风口，不论是否是互联网人，都在学习AI。那如果是没有任何基础的普通人，面对AI如何入门呢？作者给大家整理了一份学习路径，跟着这个路径学习，基本可以解决你不会用的问题。

2025-05-25 08:15:00 680

原创大模型新书丨最新中文版LLM《基于ChatGPT、GPT-4等Transformer架构的自然语言处理》（附PDF）

本书详细阐述了Transformer模型的四个关键阶段：预训练、有监督微调、奖励建模和强化学习，包括每个阶段的关键算法、数据处理方法、挑战和实践经验。

2025-05-24 11:06:49 971

原创全方位入门大模型开发，只需一站搞定：吴恩达系列课程中文教程实战指南！

本文将为你详细解析这个项目包含的各类课程内容与学习路径，展示其在 LLM 应用开发中的实战价值，助你从零起步，快速迈入大模型时代！

2025-05-24 11:05:33 902

原创谷歌出品《Agents》白皮书丨AI Agent爆了！（附PDF）

最近关于AI Agent相关的文章，谷歌的《Agents》白皮书与anthropic的《Building effective agents》都很火爆。

2025-05-24 11:04:22 816

原创有没有从零到一入门大模型的学习路线？从入门到精通，这份入门路线抓紧拿走！

有没有从零到一入门大模型的学习路线？从入门到精通，这份入门路线抓紧拿走！

2025-05-23 11:50:11 984

原创手把手分享：使用国产开源大模型ChatGLM3-6B安装+部署经验（附教程）

本文就来分享下我的安装部署经验，包括本地和租用云服务器的方式，以及如何通过API调用大模型开发自己的AI应用，希望能解决一些下不去手的问题。

2025-05-23 11:49:21 1008

原创 10分钟部署Dify：小白也能玩转大模型开发平台——打造你的私有AI助手

Dify 是一款开源的大语言模型（LLM）应用开发平台，star高达93k+，支持AI工作流编排、RAG（检索增强生成）、Agent构建等功能，即使非技术人员也能快速开发AI应用。

2025-05-22 11:34:36 560

原创后悔没早点读！这本从零构建大模型让我彻底搞懂大模型构建的每一步！

在大语言模型（LLM）成为 AI 时代核心驱动力的今天，很多开发者和研究者都渴望理解其原理，并尝试自己动手训练一个大模型。然而，大多数资料或过于抽象，或高度依赖已有框架封装，缺乏系统性的指导。

2025-05-22 11:32:37 731

原创权威力作升级！《大语言模型：从理论到实践》第二版（预览版）重磅来袭！

现在，它来了！由复旦大学张奇教授、桂韬副教授、郑锐老师和黄萱菁教授倾力打造的权威著作《大语言模型：从理论到实践》第二版（预览版）正式发布！这本书是国内 LLM 领域的集大成之作，旨在为所有对 LLM 感兴趣的读者提供一座坚实的桥梁，连接理论的深度与实践的广度。

2025-05-21 10:14:16 512

空空如也

空空如也