和老莫一起学AI-CSDN博客

原创大模型微调基础：详解大模型微调概念以及微调框架，带你彻底学会大模型微调！

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

2025-05-20 10:15:29 335

原创三种方法轻松学会微调推理大模型！

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-05-20 10:12:23 444

原创大模型开发全景指南：从理论架构到应用实践

随着对大模型技术应用的理解加深，以及和身边朋友和同事的交流，最近发现一个问题，很多人对大模型技术和应用并没有一个整体的认识；而且由于大模型属于一个新兴领域，也因此产生了很多新的概念和名词，所以这也间接导致了很多人认为大模型很难很复杂。所以，今天作者就从个人理解的角度对整个大模型体系进行梳理；虽然并不一定完全正确，也可能并不完善，但对在学习大模型的朋友来说也算是一个参考。

2025-05-20 10:07:19 395

原创零基础读懂大模型：应用场景与底层逻辑精讲，建议收藏！

LLM 通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。你可以把大语言模型想象成一个**超级学霸**，它读了互联网上无数的书、文章、对话，学会了人类语言的规律。当你问它问题或让它写东西时，它就能像人一样回答你，甚至写诗、编故事、解数学题。

2025-05-20 09:39:25 539

原创探索生成式 AI Agent：12类，40+个AI Agent实例应用场景的宝藏库

在人工智能的璀璨星空中，生成式 AI 智能体（GenAI Agents）无疑是最耀眼的星辰之一，正以前所未有的速度改变着我们与技术互动的方式。今天，我将分享 GitHub 上一个宝藏级的项目 ——“NirDiamant/GenAI\_Agents”，这里汇聚了从基础到高级的各种 GenAI 智能体技术教程与实现案例，堪称一座智能体开发的知识宝库。

2025-05-19 10:00:00 1462

在人工智能的浪潮中，科技正在改变我们生活的方方面面。从智能推荐到自动驾驶，从个性化广告到实时风险控制，AI的触角无处不在。但这些令人瞩目的成果背后，究竟是什么在支撑着AI的飞速发展？答案是——人工智能平台。人工智能平台是连接计算资源、开发工具和行业应用的重要桥梁，支撑着从模型开发到行业场景落地的每一个环节。它不仅为开发者提供高效便捷的工具，还为企业创造了无限的创新可能。本文将带你深入了解人工智能平台的构建逻辑，从基础设施到场景化应用，从技术细节到实际案例，揭示AI如何从一个抽象的概念转化为具体的商业价值

2025-05-19 09:30:00 423

原创初学者入门大模型必看：10W+下载，2025最新中文版《大模型基础》教程pdf

本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议，持续进行月度更新，致力打造易读、严谨、有深度的大模型教材。并且，本书还将针对每章内容配备相关的Paper List，以跟踪相关技术的最新进展。

2025-05-19 09:00:00 304

原创 2025年小白入门大模型必看书籍：150页的极简大模型入门，大模型神书横空出世！

如果问个问题：有哪些产品曾经创造了伟大的奇迹？ChatGPT 应该会当之无愧入选。仅仅发布 5 天，ChatGPT 就吸引了 100 万用户——当然，数据不是关键，关键是其背后的技术开启了新的 AI 狂潮，成为技术变革的点火器。就算我们这些周边吃瓜群众都日日活在 ChatGPT 带来的震撼里，更不用说在 AI 领域摸爬滚打的专家们了。

2025-05-18 10:15:00 510

原创 LLM 算法工程师的速成指南：微调、强化学习微调与偏好微调

之前大家所熟知的是，提示词工程（Prompt Engineering）：在提示词中加入指令，有时也会加入一些示例(few shots)。这种通过演示引导模型完成任务的方法，被称为“少样本学习”（few-shot learning）。微调，则是在“少样本学习”基础上的进一步提升。具体而言，我们会使用特定领域的数据来训练模型，从而使其在特定领域上表现得更加出色。换言之，微调是对模型进行针对性的“特训”，使其更好地适应特定场景。

2025-05-18 09:30:00 766

原创【2025转型必看】Java到AI，程序员的逆袭秘籍，转行人工智能不再是梦！

随着技术的不断进步，人工智能（AI）已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域，如Java，转向人工智能领域，今天小编和大家一起来探讨Java开发者是否可以转型到人工智能，转型的优势，薪资对比，以及转型所需的知识和学习路线等。

2025-05-18 09:00:00 503

原创一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系！！

当我们把AI大模型视作人的大脑时，调用A大模型就如同调用一个人的智慧。将AI大模型人格化，意味着它应该能够理解人类的语言（懂人话）、用人类的语言进行表达（说人话），并直接给出结果。然而，重要的是要认识到，尽管AI大模型可以提供快速的答案，但这些结果并不总是完全准确。

2025-05-17 10:15:00 621

原创小白入门大模型：transformer的细节到底是怎么样的？Transformer 连环18问！

第一，Transformer是既MLP、RNN、CNN之后的第四大特征提取器，也被称为第四大基础模型；最近爆火的chatGPT，其最底层原理也是Transformer，Transformer的重要性可见一斑。第二，希望通过问问题这种方式，更好的帮助大家理解Transformer的内容和原理。

2025-05-17 09:45:00 877

原创一文彻底搞懂AI技术架构：大模型、智能体与应用场景

人工智能（AI）的发展，正以前所未有的速度重塑我们的世界。从能与人对话的大语言模型到自动驾驶、精准医疗，AI 的背后究竟隐藏着怎样的技术奥秘？本篇文章将为您深度剖析一套先进的 AI 技术架构，从基础设施到应用层，每一层都充满了惊喜和启发。读完本文，您不仅能看懂 AI 的底层逻辑，还能掌握其对各行业变革的潜力与方向。

2025-05-17 09:00:00 1046

原创国产AI大模型在医疗领域应用的典型案例盘点，覆盖了十大医疗应用场景！

随着人工智能技术的飞速发展，国产AI大模型在医疗健康领域的应用日益广泛，正在逐步改变传统的医疗服务模式，提升医疗服务的质量和效率。以下是对国产AI大模型在医疗领域应用的典型案例盘点，覆盖了十大医疗应用场景。

2025-05-16 09:45:00 922

原创大模型推理框架：Ollama和vLLM到底应该选哪个？

在人工智能领域，大语言模型（LLM）的应用日益广泛，选择合适的推理（部署）框架对实现高效、稳定的模型运行至关重要。Ollama和vLLM作为当下流行的LLM部署工具，各具独特优势与适用场景。本文将深入剖析二者的优缺点，并给出选型建议，同时附上它们的具体使用案例，以便读者更直观地了解其应用情况。

2025-05-16 09:00:00 641

原创 2025年如何成为一名优秀的AI产品经理，从认知到方法，建议收藏！

在人工智能快速发展的时代，AI产品经理已成为科技行业中一个至关重要的新兴角色。作为专注于人工智能产品开发和管理的专业人士，AI产品经理需要将复杂的AI技术转化为切实可行的产品解决方案，尤其是在大语言模型（LLM）的应用领域。

2025-05-16 08:45:00 571

原创 AI大模型应用架构图大全，13张技术全景图带你彻底搞懂大模型！

大模型无疑是当前最热门的话题之一。无论是响应公司高层的战略要求，还是出于对前沿技术的持续探索，我们在项目中都需要主动挖掘大模型的应用机会。既然大模型已成趋势，那就从现在开始，积极拥抱变化吧！

2025-05-15 09:45:00 897

原创初学者入门大模型指南：大模型微调的关键技术解析

随着人工智能技术的不断突破和产业需求的快速演进，企业对大模型微调技术的重视程度日益提升。这项技术不仅依托预训练模型在多任务适应性和强大学习能力上的优势，同时也通过对特定领域数据的细致微调，弥补了全模型部署在计算资源和数据规模方面的不足。大模型微调技术在智能客服、金融风控、医疗诊断、法律咨询、内容创作等众多领域展现出巨大的应用潜力，成为推动各行业智能化升级的关键驱动力。

2025-05-15 09:30:00 490

原创 AI认知体系的六个层次，来看看你属于哪个层次！普通人、企业与AI从业者如何行动？

AI无处不在——从手机里的语音助手到工厂里的智能流水线，它正在悄然改变我们的世界。但你有没有停下来想一想：在这个AI时代，你到底站在哪里？是还在摸索它是什么，还是已经用它提升生活、驱动工作？甚至，你可能正在塑造它的未来？今天，我们将带你走进“AI认知体系”的六个层次，一步步解锁AI的奥秘，找到你的位置。无论你是门外汉还是行家里手，这篇文章都会让你有所收获。准备好了吗？让我们一起揭开AI的面纱！

2025-05-15 08:30:00 881

原创 2025年Agent智能体平台有哪些？AI智能体平台哪个更好？看完这篇文章你就懂了！

国内AI智能体（Agent）生态爆发式增长，从商业巨头到开源社区，各类产品正重塑工作与生活。智能体平台有哪些？AI智能体平台哪个更好？本文带你梳理主流智能体商业产品、5大智能体开发框架，助你找到最适合的智能体解决方案。

2025-05-14 09:30:00 1196

原创 AI圈“新顶流”MCP到底是什么？一文彻底搞懂大模型MCP从原理到应用！

MCP（Model Context Protocol，模型上下文协议），2024年11月底，由 Anthropic 推出的一种开放标准，旨在统一大模型与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题，MCP 使得 AI 应用能够安全地访问和操作本地及远程数据，为 AI 应用提供了连接万物的接口。

2025-05-14 09:15:00 751

原创小白入门大模型：全面解析多种 AI 智能体的任务规划与执行模式

大语言模型（LLM）驱动的 AI 智能体，特别是在借助Tools（工具）来完成复杂任务执行的过程中展现出了巨大的潜力。然而，让智能体能够合理规划任务步骤与执行、避免盲目行动是确保其高效可靠完成目标的关键。本篇将探讨多种 **AI 智能体的任务规划与执行模式。包括：

2025-05-14 08:30:00 654

原创一文彻底读懂大模型RAG：如何为AI精心打造一个“外部智慧大脑”

简单来说，RAG就是给AI外挂了一个可以实时更新的“超级大脑”，或者说赋予了它“开卷考试”的能力，让它在回答您的问题之前，先去您指定的、可靠的外部信息源里查证一番。

2025-05-13 09:45:00 1413 1

原创 AI产品经理核心能力框架：AI能力图谱全解析！

过去，产品经理只需要关注用户需求和流程设计。而今天，一个智能产品的能力边界取决于背后的模型、算法、数据结构与交互逻辑。AI产品不再是“堆功能”，而是“编排能力”。在这个背景下，AI产品经理必须要有一张“全景地图”来认知和调度AI能力。这张能力图谱，正是我们理解“AI能做什么、怎么做、做到什么程度”的基础。它从四个维度（知识与推理、自然语言处理、交互能力、辅助决策）展开，覆盖从输入到输出、从理解到行动的完整AI能力链条。

2025-05-13 09:00:00 806

原创 AI Agent落地：12个行业落地方向拆解

2025年，AI代理全面出圈。但与其盯着OpenAI、Anthropic这些巨头看，不如从你自己的行业切入：**假如你是某种类型的从业者、公司、团队，该怎么用AI Agent干出点事？**以下12个方向，每一个都配了思路+场景+小方案，照着做，或许你就能成为下一个案例。

2025-05-13 08:45:00 666

原创零基础小白入门AI Agent，Coze和Dify该如何选择？它们的区别到底是什么？

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-05-13 08:00:00 1097

原创终于有人说清楚了5种不同的AI知识库方案！个人和企业如何选择适合自己的知识库方案？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 **30%。**

2025-05-12 10:05:52 582

原创大模型本地知识库：白嫖Qwen3大模型，手把手教你搭建本地知识库，打造最强大脑！

如果你真的想学习大模型，请不要去网上找那些零零碎碎的教程，真的很难学懂！你可以根据我这个学习路线和系统资料，制定一套学习计划，只要你肯花时间沉下心去学习，它们一定能帮到你！

2025-05-12 10:02:10 909

原创 AI大模型RLHF 实践总结：从原理、代码以及踩坑与解决方案，这篇文章一次性说清楚！

最近倒腾了一波RLHF，从ColossalAI到TRLX以及DeepSpeed-Chat，最后基于DeepSpeed-Chat成功训练上了自己的模型，最后效果也是肉眼可见的提升。对这一部分进行下总结，包括原理，代码以及踩坑与解决方案。

2025-05-12 09:53:10 850

原创人工智能应用场景中前期数据处理的业务场景和技术分析

**“** 文档处理是人工智能应用领域中的重要环节，其业务需求复杂，技术实现难度高；因此，怎么处理复杂文档是每个技术人员都需要考虑的问题。**”**

2025-05-12 09:48:56 836

原创对比两款热门的开源工具 —— n8n 和 Dify到底怎么选？不同业务需求下做出合理的技术选型

n8n 是一个**可视化工作流编排工具**，有点像国内的钉钉宜搭、国外的Zapier或Make.com。它可以帮助你通过图形化的方式，把各种API、服务、数据库连接起来，实现自动化的任务流转。

2025-05-11 09:30:00 908

原创连Transformer都搞不懂的AI工程师和传统程序员没什么区别！

你是不是曾经看了不下几十篇关于Transformer的视频和教程，但最后对于Q、K、V（查询、键、值）依然感到一头雾水？简历中写的精通Transformer，又害怕面试官问到，别担心，这是很多AI学习者的共同困惑。原来我搞了半年只搞懂前面五步，确实比较难，但是只要肯钻研，迟早能一点一点理解。今天，我不会给你晦涩的数学公式堆砌，而是用一个步骤清晰例子，帮你真正掌握Transformer的工作流程，尤其是那个让人困惑的自注意力机制。

2025-05-11 09:00:00 515

原创大模型时代，什么样的算法工程师更吃香？

毫无疑问，全栈型的算法工程师将更为抢手，如果你精通大模型从训练到应用的整个流程，你走到哪里都不怕。但往往人的精力有限，如果从数据、预训练、微调、对齐、推理、应用几个方面来看的话，个人觉得“预训练>数据>应用>对齐>推理>微调”。先说一下各个方向的特点，再说我为啥这么排序吧。**纯个人看法，不喜勿喷，但交流欢迎讨论（叠甲叠甲）。**

2025-05-11 08:15:00 531

原创一文彻底搞懂大模型中的MCP原理：从入门到实践的全方面解析

在人工智能快速发展的今天，大语言模型（LLMs）已经展示了强大的文本理解和生成能力。然而，这些模型通常存在一个关键限制：它们无法直接访问和使用外部数据源和工具。这意味着即使是最先进的LLMs，也无法获取最新的实时信息或直接操作外部系统。为了解决这个问题，Anthropic公司在2024年11月开源了Model Context Protocol（MCP），这是一个革命性的开放协议，旨在标准化大语言模型与外部数据源和工具之间的交互。MCP的出现被认为是AI领域的一个重要里程碑，它有望从根本上改变我们使用和集成

2025-05-10 10:00:00 942

空空如也

空空如也