大模型学习-CSDN博客

原创新手必看！我如何6步用（Coze）轻松搭建了一个AI智能体

AI智能体就像是一个虚拟的"小助手"。它能听懂你的话，理解你的需求，并帮你完成任务。想象一下，你有了一个24小时待命的私人助理，随时随地为你服务。这就是AI智能体的魅力所在。

2025-01-04 17:19:05 8663

原创一图了解大模型是什么？附国内外知名大模型及240余家大模型清单！

引申到模型层面，涌现能力指的是当模型的训练数据突破一定规模，模型突然涌现出之前小模型所没有的、意料之外的、能够综合分析和解决更深层次问题的复杂能力和特性，展现出类似人类的思维和智能。简而言之，大模型是指利用海量数据，通过先进的算法和技术，训练得到的具有强大预测和决策能力的模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法，在大规模无标注数据上进行训练，以寻找特征并发现规律，进而形成可“举一反三”的强大泛化能力，可在不进行微调或少量微调的情况下完成多场景任务，相当于AI完成了“通识教育”。

2024-12-09 16:00:36 4141

原创太强了！10大开源大模型！

近期，Meta 隆重推出了两款开源模型：Llama 3 8B与Llama 3 70B，这两款模型可供外部开发者免费使用。Meta 表示，Llama 3 8B和Llama 3 70B在目前同体量模型中，展现出卓越的性能，堪称业界的佼佼者。从Meta 分享的基准测试结果来看，Llama 3 400B+ 的实力不容小觑，其性能已逼近Claude超大杯以及新版GPT-4 Turbo，虽然还存在一定的差距，但足以证明它在顶尖大模型领域已占有一席之地。

2024-11-23 11:20:38 5169

原创 “农业+大模型”的八大应用场景及成功案例

当前处于一个农业生产力提升与城镇化融合发展的一个关键时期，此前受耕作主体分散和生产水平的影响，我们的农业在解决了温饱水平之后，长时期处于碎片化作业与集约化程度不足的状态。随着近年智慧化应用积累和大模型的快速发展，“农业+大模型”的结合发展成为一种新的产业形态，也需要从体制到从业主体各个层面的改革以适应科技生产力的发展。农业与大模型的结合是新质生产力的体现，大模型在农业中的应用正是通过引入先进的人工智能技术，提升农业生产的智能化、精准化水平，从而创造新的价值和效率。丨。

2024-11-07 16:39:52 5424

原创什么是LLM？看这一篇就够了！

自从2022年12月 ChatGPT 横空面世以来，AI 领域获得了十足的关注和资本，其实AI的概念在早些年也火过一波，本轮 AI 热潮相比于之前的 AI，最大的区别在于：生成式。本文主要介绍大语言模型（Large Language Model，简称LLM）。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。

2024-08-20 20:44:43 3299

原创无需本地部署！免费使用开源大模型API

之前，我给大家分享过几篇关于如何在本地部署开源大模型以及应用场景的文章。比如说，给本地大模型添加知识库、API的调用等等。在这个过程中，有粉丝反馈自己不会部署，或者电脑配置不好，想知道还有没有办法使用这些开源大模型。今天就来分享一个免费且无门槛使用各种主流开源模型及其API的方法，让你不用在本地部署开源模型，也可以在各种第三方应用中调用这些模型，例如翻译插件、Dify的工作流、对话应用等等。这些场景下都可以用这个方法来省钱。我们今天要用的平台名字叫Groq。

2024-07-10 09:53:46 4490 1

原创收藏备用｜Java程序员中年危机破解：AI大模型时代，自我赋能指南（小白/从业者必看）

近年来，AI技术的迭代速度堪称“飞速”，尤其是ChatGPT、GPT-4、文心一言等大模型的持续爆发，彻底打破了程序员行业的传统格局。作为长期占据企业级开发核心、曾被贴上“高薪稳定”标签的Java程序员，如今不得不直面一个扎心现实：传统编程技能的“保质期”越来越短，单纯靠写业务代码、堆砌开发经验，早已跟不上行业发展的步伐，中年焦虑也随之而来。如果你是一名Java程序员——不管是刚入门的小白，还是工作3-5年陷入瓶颈的从业者，亦或是35+面临转型压力的中年人，是否也曾有过这些困惑？

2026-02-17 10:15:00 593

原创必收藏！AI Agent规划模式详解｜小白&程序员入门大模型必备

通俗来讲，规划模式就是让AI Agent在“动手做事”之前，先“想清楚怎么做”，提前制定好完整的计划或解决方案，再按计划执行。这里一定要区分开规划模式和ReAct模式（很多小白容易混淆，重点记！）：ReAct模式的Agent会直接深入到“逐步推理+工具使用”的环节，走一步、看一步、调整一步；

2026-02-16 09:30:00 467

原创收藏备用｜大模型入门到进阶全指南程序员必看（含DeepSeek实操解析）

本文将系统拆解大模型的发展脉络、核心分类及关键技术，清晰区分基础模型、通用模型与推理模型的核心差异，深度解析Transformer架构、MOE架构的底层逻辑，以及预训练、微调、对齐等完整构建流程。

2026-02-15 11:15:00 568

原创珍藏版！LangChain 1.0保姆级教程：6.9万字含代码，RAG+Milvus+Ollama+MCP+Agents实战，从入门到精通

本文介绍了LangChain 1.0框架及其在大语言模型(LLM)应用开发中的核心功能。LangChain作为连接LLM与外部组件的开发框架，提供Model I/O、Chains、RAG、Agents等模块，支持构建问答系统、智能助手、数据分析等多种应用场景。文章详细阐述了LangChain的生态定位、架构设计以及实际应用案例，如文档问答、智能客服、多模态处理等，帮助开发者快速掌握LLM应用开发技能。通过统一API调用、链式组装等功能，LangChain显著降低了LLM应用的开发难度。

2026-02-15 10:15:00 1123

原创【深度收藏】大模型记忆架构设计：RAG与CAG如何选择？实战指南

RAG与CAG：大模型记忆架构选择指南 RAG（检索增强生成）适用于海量动态数据，通过外部检索获取信息；CAG（缓存增强生成）适合稳定小数据集，利用KV缓存实现低延迟响应。两者互补而非竞争：RAG优势在于动态知识扩展与来源追溯，CAG则在复用场景下更经济高效。未来趋势是分层混合架构（CAG处理核心知识+RAG处理长尾搜索）。选择依据应综合考虑数据规模、稳定性、更新频率和查询量等因素，建议小型稳定数据用CAG，大规模动态数据用RAG，复杂场景采用混合模式。（149字）

2026-02-15 09:00:00 327

原创收藏！AI时代计算机就业真相：不是凉透了，是换赛道了（小白/程序员必看）

这张2024-2025年的招聘数据图，核心不是要告诉大家“计算机就业行不行”，而是要提醒大家——“你能不能跟上AI的节奏”。AI不是程序员的敌人，而是最高效的工具：会用它的人，能把工作效率提升3倍，薪资上涨50%甚至翻倍；不会用它、固守传统技能的人，才会被行业淘汰。现在计算机依然是“高薪、需求大”的行业，只是“高薪”的门槛变了——以前靠“埋头写代码”就能拿高薪，现在靠“会用AI、能解决核心问题”拿高薪。

2026-02-14 10:15:00 486

原创大模型训练深度解析：数据、算力、算法三大核心要素详解（建议收藏）

文章以"孩子上学"为类比，生动阐述了大模型训练的三大阶段：预训练（小学阶段）通过海量阅读和填空练习掌握基础语言能力；微调（中学阶段）学习逻辑推理和指令理解；对齐（大学阶段）优化价值观和安全性。训练前需准备优质数据（教材）、强大算力（教室）和高效算法（老师）。文章强调训练投入与模型能力成正比，并指出大模型最终目标是"向人靠拢"，从会说话到会做事再到懂人心，让技术更好服务人类需求。

2026-02-13 17:00:00 551

原创必收藏｜RAG技术全解析（小白友好）：分块策略+新一代架构，程序员入门大模型必备

作为人工智能领域最早实现落地应用的核心技术之一，RAG（检索增强生成）始终保持着高速迭代的发展态势，更是当前大模型落地的“关键抓手”。在AI系统的性能评价体系中，RAG的质量早已成为决定性因素——顶尖的RAG系统能实现近乎100%的信息召回率与99%以上的检索准确率，这两大核心指标，直接决定了大模型输出内容的可靠性、专业性，更是避免大模型“胡言乱语”（幻觉生成）的核心保障。

2026-02-13 12:00:00 619

原创【收藏】2026 大厂后端校招面试全攻略！从简历到 Offer，字节 / 阿里上岸者亲授（附 LFU 代码 + 系统设计思路）

请用2-3分钟做自我介绍，重点说下后端相关经历。”这是必答题，但很多人陷入“流水账”误区。我的回答围绕“技术匹配度”展开，小白可直接套用这个结构：技术基础：本科系统学习计算机组成原理、数据库等课程，GPA 3.7/4.0，自学Java并发编程、Redis缓存设计，获学校算法竞赛二等奖；项目实践：重点说实习的高并发订单系统，我负责支付模块，解决了库存超卖和接口超时问题——通过Redis分布式锁+RabbitMQ异步处理，接口成功率提升至99.99%，QPS从2000提至8000；

2026-02-12 10:30:00 623

原创【必藏干货】Agent三大杀手锏揭秘：从游击队到正规军的进化之路，构建未来智能体生态系统

《AI智能体三大演进方向：从单兵作战到军团协同》摘要：白皮书揭示AI智能体发展的三大突破性方向：1）契约智能体通过结构化数字契约建立权责分明的协作框架；2）Agentic RAG赋予知识检索系统自主思考与多步推理能力；3）Agentspace平台实现企业级智能体的统一管理与协同作战。这三大技术将推动AI智能体从孤立工具进化为具备组织协作能力的数字员工体系，解决规模化应用中的信任、安全与协同难题，标志着AI进入"集体智能"新阶段。（149字）

2026-02-12 10:00:00 316

原创收藏！00后月入百万的AI黄金职业｜提示词工程师入门指南（小白/程序员必看）

提示词工程师的走红，本质上是AI技术普及带来的“时代红利”。它不像传统职业那样需要“十年磨一剑”，也不需要太高的门槛，而是给了小白、程序员一个“用新技能快速突围”的机会——无论是学生想增加副业收入，还是职场人想转型，或是程序员想提升效率、增加变现渠道，只要愿意花时间学习、实操，就能抓住这波机遇。就像00后小林的经历所证明的：在AI时代，“财富密码”不再是“熬资历”“拼资源”，而是“懂AI、会用AI”。

2026-02-11 12:30:00 492

原创【收藏向】从零构建230万参数小型语言模型（LLaMA架构，小白可实操，无高端GPU也能练）

在最初的 LLaMA 论文中，使用了谷歌的 SentencePiece 字节对编码Tokenizer。不过，为了简单起见，我们将选择基本的字符级Tokenizer。

2026-02-11 11:00:00 557

原创必收藏！AI大模型入门指南｜小白&程序员转行/学习全攻略（含热门岗位解析）

当下，AI技术早已跳出实验室的局限，完成了从理论探索到实际应用的跨越式发展，悄无声息地融入我们工作生活的方方面面。小到日常使用的智能语音助手、居家必备的智能家电，大到保障出行安全的自动驾驶系统、助力企业降本增效的智能办公平台，AI的应用边界还在持续拓宽。而支撑这一切场景落地的核心动力，正是不断迭代升级的AI大模型——它们就像AI领域的“智能心脏”，为各类技术应用提供底层支撑，也是当前AI行业最具发展潜力的赛道。在众多AI玩家中，DeepSeek的崛起堪称行业内的“黑马破局者”。

2026-02-11 11:00:00 511

原创收藏备用！用“预制菜”讲透大模型开发：小白/程序员必看，自建不如选预制更高效

本文用大家熟知的“预制菜”作比喻，拆解大模型开发的核心逻辑，清晰对比「从零自建大模型」与「使用预制模型」的差异的优劣势。对于开发者（尤其是小白）和企业来说，自建大模型需直面算力、数据、技术、业务定位四大难题，而MaaS平台提供的“预制模型服务”，如同即烹、即热、即食的预制菜，能大幅降低开发成本、缩短落地周期，提升效率。文末给出核心建议：无论小白入门、程序员练手还是企业落地，优先选择预制大模型方案，避免盲目投入资源“从零造轮子”。

2026-02-10 11:45:00 595

原创收藏备用｜35岁不是终点！程序员/小白必看，中年转型AI+大模型的可行之路

在AI+大模型爆发的时代，技术迭代的速度越来越快，但“持续学习”的能力，永远是最核心的竞争力。很多小白和程序员担心自己35+学不动新技术、跟不上潮流，却忘了：35+的你，有年轻人没有的经验沉淀、有更成熟的心态、有更强的执行力，这些都是你转型的底气。AI+大模型从来不是年轻人的专属游戏，而是所有持续学习者的舞台。35岁后转型AI，不是一场“赌局”，而是一次“顺势而为”的选择——选择适合自己的方向，制定科学的学习计划，发挥自身的优势，小白能入门，程序员能进阶，你完全可以重新定义自己的职业未来。

2026-02-10 10:15:00 1241

原创必收藏！Agentic RAG详解：传统RAG+Agent融合，小白也能看懂的大模型进阶技术

Agentic RAG就是一种融合了Agent能力的RAG，而Agent的核心能力是自主推理与行动。所以。

2026-02-10 09:15:00 1458

原创【收藏必看】Agent评测体系实战指南：3大评分器+2大框架，建立可量化的信任机制

本文系统阐述了Agent应用评测体系的构建方法与实践策略。评测体系由任务、试验、评分器、记录等核心组件构成，需组合代码评分、模型评分和人工评分三类方法。以深度研究Agent为例，文章展示了从数据收集、意图分类到基准任务构建的全流程，并重点介绍了RACE（报告质量评估）和FACT（事实准确性评估）两大互补框架。RACE采用动态加权评估报告质量，FACT则聚焦引用准确性验证。实践建议包括：从真实场景提炼小样本任务、建立鲁棒评分体系、持续迭代评估标准，从而将主观体验转化为客观指标，实现Agent能力的精准度量与可

2026-02-09 18:00:02 479

原创收藏！后端/小白转大模型必看｜避坑+岗位+学习路径，过来人掏心窝分享

聊到转行，不管是小白还是资深程序员，都绕不开这个现实问题：“大模型是新风口，人才缺口大，是不是竞争小、更好就业？能不能靠这个避开35岁瓶颈？现在转，还来得及吗？大模型确实是当下确定性最高的技术风口，人才缺口大，竞争相对温和，但“抗危机”的核心不是行业，而是你的“不可替代性”。企业缺的不是“会用大模型API”的人，不是“能跟着教程搭模型”的人，而是“能结合业务场景，用大模型解决实际问题”的人——这也是小白和转岗程序员的核心突破口。

2026-02-09 15:52:05 471

原创必收藏！程序员&小白零基础AI入门指南，从认知破局到实战落地（附专属工具+代码示例）

当ChatGPT快速生成规范接口文档、MidJourney一键勾勒产品原型草图、AI代码助手实时补全调试语句甚至排查BUG时，人工智能早已跳出实验室的围墙，深度融入程序员的IDE编辑器、职场人的办公套件，乃至普通人的日常手机应用中。但身边仍有大量朋友——无论是刚踏入开发行业的编程小白，还是想借助AI提升工作效率的职场开发者，都被“零技术背景无法入门”“需要高深数学功底”的固有标签吓退，始终觉得AI门槛高不可攀，只能望而却步。

2026-02-09 15:50:55 591

原创必收藏！小白&程序员入门大模型必备：AI发展、LLM机制及全球产业全景

再后来，模型知道了一些人类的偏好，通过强化学习生成答案，人类通过一些打分机制，使模型进一步自我迭代进化。

2026-02-09 15:50:07 700

原创收藏备用｜大模型RAG系统准确性优化6大策略（小白&程序员入门必备）

*数据处理阶段：**对原始数据进行清洗和处理，然后将处理后的数据转化为检索模型可以使用的格式，最后存储在对应的数据库中。**检索阶段：**将用户的问题输入到检索系统中，从数据库中检索相关信息。**增强阶段：**对检索到的信息进行处理和增强，以便生成模型可以更好地理解和使用。**生成阶段：**将增强后的信息输入到生成模型中，生成模型根据这些信息生成答案。

2026-02-07 12:45:00 971

原创必收藏！Transformer核心组件深度解析（小白/程序员入门大模型必备）

跟着系列文章学到这里，终于来到Transformer的终极总结篇！先给大家梳理一下，前面四篇内容我们重点讲解了Transformer的核心运算流程，比如词嵌入的实现、注意力分数的计算步骤、Encoder与Decoder的整体链路等，但为了降低小白的理解门槛，很多“背后的设计逻辑”都一笔带过——毕竟只会算“怎么做”，不懂“为什么这么做”，始终无法真正吃透Transformer，更难举一反三理解后续的大模型变体。

2026-02-07 09:58:28 223

原创收藏！AI大模型入门指南｜小白&程序员零迷茫学习路线，避开陷阱快速上手

如今打开CSDN、掘金等技术社区，AI大模型相关的文章、课程、实战案例早已刷屏。无论是深耕开发领域多年的资深程序员，还是刚踏入技术圈的小白新手，都想抓住这波AI技术浪潮，实现能力升级。但随之而来的，是绝大多数人的学习迷茫：市面上的学习资料杂乱无章，从深度学习底层理论到Prompt工程、模型微调，到底该从哪里切入？担心自己没有扎实的数学基础学不会，又怕盲目跟风、踩坑走弯路，最后半途而废。

2026-02-07 09:54:58 419

原创必收藏！RAG（检索增强生成）全解析｜从入门到进阶，小白程序员也能轻松学懂

RAG特点优点Naive RAG- 单一索引，如TF-IDF、BM25、向量检索- 简单，易于实现 - 缓解模型幻觉- 文档增强 - 索引优化 - query重写 - reranking- 更准确的检索 - 增强检索相关性- 混合检索 - 工具、API集成 - 模块化、工程化的实现- 更强的灵活性 - 适应更多元的场景Graph RAG- 图结构索引 - multi-hop推理 - 基于图节点的上下文内容增强- 关系推理能力 - 适合结构化数据。

2026-02-07 09:54:11 370

原创收藏备用｜从零构建AI Agent全流程（8步落地，小白程序员也能轻松上手）

AI Agent（智能体）早已不是行业噱头，而是当下程序员提升开发效率、自动化复杂重复任务的核心利器。它不再是单纯执行指令的基础模型，而是一套能自主感知环境、分析需求、做出决策并落地行动的完整系统——对于想要入门大模型、提升自身竞争力的程序员和小白来说，掌握AI Agent的构建方法，无疑是加分项。那么，如何从零开始，一步步搭建出高效、可靠，还能贴合自身需求的AI Agent呢？

2026-02-07 09:53:26 331

原创【收藏必看】RAG+Agent+多模态：大模型三大核心技术如何重塑产业未来？

大模型技术正通过RAG、Agent与多模态协同演进突破应用边界。RAG解决静态知识时效性问题，Agent赋予自主决策能力，多模态实现跨模态理解。三者融合攻克了数据时效性、隐私安全等关键难题，推动产业从效率革新迈向业务重构。未来将向知识图谱、具身智能等方向发展，催生新一代智能体。技术演进呈现知识增强→行为智能→感知升级的完整路径，为产业数字化转型提供核心引擎。

2026-02-06 19:36:19 201

原创一人独角兽的黎明：AI Agent如何让你成为工作流架构师 | 程序员必藏

AI Agent正在重构工作范式，推动人类从"操作员"向"架构师"转变。传统知识壁垒被打破，学习方式从囤积转向调用，核心竞争力转向流程工程和系统思维。Agent作为数字分身，通过私有数据和记忆积累形成独特竞争力，催生"一人独角兽"模式。未来将分为设计工作流的人和执行工作流的人两类，系统构建能力和数字资产成为关键优势。这一变革要求人类提升逻辑思维、系统设计和审美鉴赏力，实现与AI的高效协同。

2026-02-06 19:35:11 168

原创【必看】LangChain+RAG构建智能客服系统，附完整代码和部署教程，建议收藏！

本文介绍了基于LangChain和RAG技术的智能客服问答系统实现方案。系统通过将项目文档构建为知识库，利用FAISS进行高效向量检索，结合Qwen2.5模型生成准确回答。文章详细阐述了系统架构、技术选型、实现代码和部署流程，展示了RAG技术在客服场景下的应用价值。该系统具有准确性高、上下文感知能力强、可扩展性好等特点，能显著提升客服效率和用户体验。

2026-02-06 19:34:11 202

原创 2026年Agent开发必备：Agent Skills vs MCP全解析，收藏级干货

Agent Skills是解决AI智能体不稳定问题的关键方案，本质是为智能体提供结构化的"标准作业指导书"，通过渐进式加载和脚本执行，实现流程稳定复用。它与MCP有本质区别：MCP解决"接得上"的问题，而Agent Skills解决"干得对"的问题。两者结合使用可实现更稳定高效的Agent应用，代表了未来Agent工程化的重要方向。我最近一直在折腾智能体：折腾完之后，一个感受特别强烈：今天能干活，明天就乱来；这次流程顺，下次步骤就丢；你以为是模型不靠谱，其实是——你没给它一份明确的“使用说明书”。这，

2026-02-06 19:33:30 212

空空如也

空空如也