打造全国最全的AI Agent开发知识领域的博客

实战级AI Agent以及相关架构博客，生产级设计与代码示例，以喂饭式教程带领读者从浅入深学习最前沿的技术。

原创推理模型与普通模型的思考逻辑到底有什么不一样

当AI开始“思考”，传统LLM遭遇颠覆性挑战！本文深度解析推理模型与普通LLM的核心差异，揭秘其如何通过内置逻辑链与自主纠错机制，在复杂推理任务中实现质的飞跃，同时揭示其成本与应用场景的真相——原来“思考”也要算钱！

2025-05-31 16:47:16 586

原创智联未来：低空产业与AI新纪元-（下）

本篇继低空产业与AI的上篇后，从产业布局、未来竞争、伦理挑战、趋势预测详细解读了低空经济与AI的深层次的关系与定义。

2025-05-31 01:23:13 663

原创智联未来：低空产业与AI新纪元-（上）

低空经济正与AI技术碰撞出颠覆性火花！本文从1000米以下空域的商业价值切入，揭示人工智能如何重构物流配送、农业植保、城市交通等传统领域。深度解析三大核心场景，揭秘某科技公司AI算法突破暴雨干扰的黑科技，看中国如何在这场空地革命中实现弯道超车。文中通过具体案例与数据对比，展现低空经济对日常生活的深刻改变。

2025-05-31 01:16:13 690

原创数据基座觉醒！大数据+AI如何重构企业智能决策金字塔（下）

当数据架构遇见AI魔法，企业决策正在经历核聚变式质变。本文揭示数据金字塔如何在AI催化下完成智能跃迁，通过20+真实行业场景拆解，带你看清传统决策模式如何被彻底颠覆。从生产线到用户客厅，从历史数据到未来推演，这场静默的智能革命正在重塑商业世界的游戏规则。

2025-05-30 22:44:37 609

原创数据基座觉醒！大数据+AI如何重构企业智能决策金字塔（上）

当数据洪流撞上AI算力，企业数据架构正在经历一场静默革命。本文解剖大数据平台六大核心分层，揭示AI如何从原始数据沼泽到智能决策尖端的全链路重构。看算法如何让冷数据沸腾、让业务洞察自生长、让供应链学会“未卜先知”。

2025-05-30 22:39:21 1139

原创 AI神话破灭？Java之父怒揭编程真相：工具再强也绕不开人类智慧

当生成式AI掀起编程革命浪潮时，Java之父James Gosling却泼出一盆冷水。这位亲手缔造跨时代语言的天才直言："AI不过是高级统计工具，真正创造价值的永远是程序员大脑。"本文通过30年编程语言演化史、AI技术局限性剖析、企业级开发真实案例，揭示代码世界不为人知的底层逻辑。数据显示Java仍占据全球企业后端市场42%份额，而AI生成代码准确率不足60%。这场人机博弈背后，藏着软件工程最本质的生存法则。

2025-05-30 22:18:55 415

原创智变破局：DeepSeek大模型重构银行业的未来图景

当DeepSeek R1掀起推理革命，银行业正站在智能化转型的临界点。本文通过解构大模型技术演进脉络，揭示其在信贷风控、智能营销、数字员工等场景的突破性应用，以某国有大行试点数据佐证效率跃迁，更直面算力成本、知识幻觉等现实挑战，为行业提供可落地的技术路线图。这不仅是AI与金融的碰撞，更是商业逻辑的重构。

2025-05-30 21:18:15 517

原创自证式推理训练：大模型告别第三方打分的新纪元

VeriFree突破性地以模型自身对参考答案的条件概率替代传统验证器，实验证明其在MMLU-Pro等多领域推理任务中性能媲美甚至超越第三方打分机制，为通用推理训练开辟低耗高效新路径。

2025-05-30 20:56:20 641

原创神经网络学习的五大核心秘籍：从误差到精准的进化之路

本文以"误差驱动进化"为核心视角，揭示神经网络从随机猜测到精准预测的完整学习链路。通过拆解误差计算、梯度下降、参数更新等五大核心步骤，结合人类学习行为的类比分析，深度解析模型如何自主优化参数、突破过拟合陷阱。特别引入可视化训练过程数据对比，展现不同优化策略对模型性能的提升效果，为读者构建完整的神经网络学习认知体系。

2025-05-28 21:27:17 797

原创 AI进化论：2025 Google I/O开发者大会智能体革命全解码

2025年Google I/O开发者大会揭晓了Gemini 2.5 Pro智能体生态、端侧AI医疗模型MedGemma、异步编程机器人Jules等突破性技术。本文深度解析生成式AI如何重构开发范式，通过多模态交互、跨平台智能代理、开源模型矩阵三大维度，揭示全球顶尖科技公司首次披露的开发者工具链革新方案，为从业者绘制下一代智能应用的技术蓝图。

2025-05-28 18:58:33 949

原创 “潘神迷宫”中的AI谎言：解码上下文幻觉如何瓦解人类信任

当AI自信地编织虚假信息时，我们是否还能相信它？本文通过真实案例揭示LLM的“自信陷阱”——上下文幻觉如何在医疗、金融等关键领域埋下风险，剖析其技术根源与破解之道，探讨AI信任危机背后的深层逻辑。

2025-05-28 16:27:42 1353

原创 AI Agent开发第76课-Dify N8n一类的AI流程“出轨“时会爆发什么样的工程灾难

本文探讨低代码Agent工作流平台（如Dify、n8n）在企业AI落地过程中因使用不当引发的技术灾难。通过真实案例剖析跨界混用、边界模糊等问题如何摧毁系统架构，并提供专业解决方案，助您在AI工程化道路上避开这些致命陷阱。

2025-05-28 16:22:02 763

原创 AI Agent开发第75课-数据、张量、流水线并行全解析

单卡显存撑不起千亿参数？本文深度拆解数据并行（DP）、张量并行（TP）、流水线并行（PP）、序列并行（SP）与专家并行（EP）的核心原理与实战策略。从矩阵切分到长序列优化，从通信开销分析到流水线调度策略，揭秘DP的高效边界、TP的显存压缩、PP的气泡率优化、SP的动态负载均衡及EP对MoE模型的适配性。五类技术如何协同构建超大规模模型训练体系？中国AI研发者正以创新并行架构，为全球大模型进化注入中国智慧！

2025-05-27 15:20:31 152

原创 AI编程革命遇冷？谷歌科学家泼冷水，Agent保姆悄然上岗

谷歌DeepMind首席科学家Denny Zhou直言，AI短期内难以攻克日常编程难题，而硅谷技术圈却掀起“Agent保姆”热潮。从Claude 4到Manus，AI代理技术正以松耦合架构重塑开发模式，微软、大厂纷纷押注。一边是理想与现实的落差，一边是技术迭代的狂奔，这场编程革命究竟走向何方？

2025-05-27 15:03:10 418

原创纯视觉推理新纪元：Google等突破语言中介，用图像直接规划未来

Google联合剑桥大学等机构提出视觉规划新范式（VPRL），通过纯图像序列实现无需语言中介的AI推理。该框架基于强化学习与GRPO算法，利用图像状态转换计算奖励信号，在迷宫导航等任务中准确率达80%，性能超文本推理40%。实验验证其鲁棒性与泛化能力，为多模态推理开辟新方向，推动AI向更直观的图像化决策演进，中国AI研究者亦在该领域加速布局。

2025-05-27 14:56:53 635

原创英伟达破局1000 Token/秒！Llama 4以光速重塑AI推理边界

英伟达以单节点8颗Blackwell GPU实现Llama 4每秒1000 token生成速度，刷新全球AI推理纪录。通过FP8数据格式、CUDA内核融合及推测解码技术，单台服务器吞吐量达72,000 TPS，为实时决策、大规模AI部署提供全新可能。这场速度革命背后，是硬件架构与软件优化的深度协同，重新定义了超大规模模型的效率天花板。

2025-05-25 22:00:16 980

原创 MLA：Transformer的智能变形金刚——解密多头潜在注意力的进化密码

MLA（Multi-head Latent Attention）通过创新的"变形"机制，实现训练与推理场景的智能切换，以"训练用MHA+推理用MQA"的双模式设计，在保持高性能的同时降低计算与内存成本。实验表明，其核心优势源于head_dims的动态扩展、Partial RoPE的位置编码优化及KV-Shared的参数共享策略，三者协同将Transformer的效率推至新高度。

2025-05-25 21:53:40 569

原创 AI Agent开发第74课-解构AI伪需求的魔幻现实主义

当企业陷入"不加AI不罢休"的疯狂内卷，连传统电风扇都被强行塞进云端大模型。本文通过拆解声控换风、数字转译等离谱操作，揭露伪AI需求如何把简单功能变成反向创新，用幽默视角透视技术泡沫背后的资源浪费与认知偏差。

2025-05-24 20:32:41 203

原创小而美陷阱：90%AI创业者忽视的生存法则

AI创业浪潮中，多数人将“小而美”视为圭臬，却陷入致命的认知盲区。文章揭示规模化、技术壁垒、生态布局三大核心命题，通过数据对比与案例剖析，指出AI产品需以指数级增长为起点，以技术护城河为根基，以生态协同为终局。创业者需警惕“精致陷阱”，拥抱颠覆性创新，方能在智能时代突围。

2025-05-24 18:19:38 1174

原创 AI智能体狂飙突进：10大行业20个赚钱场景全解析

智能体技术正以颠覆性姿态渗透各行业，本文通过20个真实商业案例揭示AI如何重构商业逻辑。从零售门店的客户管理到制造业的设备诊断，从教育机构的智能助教到医疗机构的健康管家，智能体正在重塑企业运营效率与用户价值。数据显示，采用智能体的企业平均获客成本下降35%，服务响应速度提升5倍，揭示AI商业化落地的黄金窗口期已至。

2025-05-24 18:13:56 1049

原创纯蒸馏革命：成本直降50倍，开源SOTA模型重塑AI训练范式

近日，a-m-team团队发布论文《Not All Correct Answers Are Equal: Why Your Distillation Source Matters》，提出基于AM-Thinking-v1的纯蒸馏模型在推理任务中达到SOTA水平，训练成本较传统SFT+RL方式降低50倍。通过开源189万条高质量推理数据集，该技术为中小企业提供了低成本构建高性能模型的路径，标志着AI训练范式向"数据驱动蒸馏"的转折点。

2025-05-23 14:55:38 537

原创微软Magentic-UI震撼发布！AI助手迈入“可控、协同、透明”全新时代

微软推出全球首个可交互式多智能体Web操作系统，支持网页自动操作、代码生成及任务复用，实现AI助手的透明化、可控化与协同化，重新定义人机协作边界。该系统基于AutoGen框架，集成智能体协作网络，支持实时介入与任务复用，已在金融、科研等领域验证效率提升60%以上。

2025-05-23 14:51:01 823

原创破译AI高情商密码：LLM情感引擎如何学会“见人说人话“

本文揭秘大语言模型（LLM）在多轮情感对话中的突破性进展——通过策略级马尔可夫决策过程（MDP）与强化学习融合，实现对话长期价值规划。以straQ*框架为核心，解析LLM如何从单轮即时响应转向多轮策略优化，结合实验数据与生活化案例，探讨其对情感支持、客服等场景的颠覆性影响。

2025-05-23 01:41:10 856

原创 AI价值的冰与火之歌：企业数字化转型的迷雾与曙光

在AI技术浪潮席卷全球的今天，企业对AI的期待与现实应用效果之间存在显著落差。本文通过剖析企业AI落地的七大核心矛盾，揭示了技术狂热背后的落地困局，并以实际案例与数据为支撑，提出破局路径。AI并非万能钥匙，其价值需通过场景聚焦、组织变革与长期主义方能显现，而中国AI生态的蓬勃发展正为全球提供新的可能性。

2025-05-22 21:55:35 541

原创 AI Agent开发第73课-预训练qwen3-如何加入自己的语料

今天我们来讲，如何把本企业的内部知识库如：员工手册、退货流程或者一些达半年都不太变动的“固定”知识“烧”进Qwen3里。如之前篇章里说到过的：经常变动的、实时变动的我们要用RAG，而需要写入“DNA”的我们需要训练。因此今天讲的训练和上次的SFT微调还不一样，今天讲授的是没有一问、一答这种格式就是一大段一大段的真正的行业知识把它烧进一个LLM，其实相当于制作一个“行业LLM”，在此我们依旧使用的是Qwen3:0.6b

2025-05-22 21:33:42 834

原创红杉闭门会谈智能体经济崛起：AI价值交付革命重构万亿市场

红杉AI闭门会揭示AI商业化路径重大转向——从工具销售迈向收益交付。垂直领域突破、入口之争与智能体经济三大趋势重塑产业格局。医疗、法律等专业场景率先爆发，AI代理接管任务调度，驱动企业从成本中心转向价值引擎。万亿市场正在重构，一场以结果为导向的AI革命悄然启动。

2025-05-21 14:46:46 859

原创大模型已封顶，垂直深水区崛起：OpenAI掌门人红衫会爆论

OpenAI创始人Sam Altman在红杉AI峰会直言，大模型竞争已触及物理与经济双重天花板。数据显示，垂直场景AI应用的回报率是通用大模型的3.2倍，而某头部公司通过轻量化模型实现月营收破亿。他建议创业者转向"核心交互界面+垂直工程化落地"，并透露OpenAI将聚焦订阅服务与底层模型，释放出万亿级生态位。这场演讲为AI创业划出新边界：从算力军备竞赛转向场景深耕。

2025-05-21 14:31:38 949

原创智能体进化论：大模型×强化学习解锁推理新纪元

强化学习与大模型的深度融合正在重塑人工智能的推理范式。从PPO到GRPO的算法迭代，智能体通过试错与奖励机制突破传统推理边界，但RLHF的缺陷与技术单一化争议也引发学界反思。这场由硅谷主导的技术革命，正在全球范围内掀起一场关于“机器如何思考”的深度博弈。

2025-05-21 01:50:05 1106

原创 AI Agent开发第72课-喂饭级教授训练本地带思维链模式的模型-全网唯一正确教程

本篇是全网（包括llama-factory官网）唯一一篇讲述如何微调带有reasoning的模型如：deepseek、qwen3的一部教程，并以喂饭式的一步步教会大家如何微调一个模型并把微调后的模型装入ollama来使用的全步骤，为大模型技术方面不可多得的“宝典级教程”。

2025-05-21 01:42:59 608

原创 AI Agent开发第71课-一个完善的可落地企业AI Agent全架构

全文介绍了基于当前最新RAG设计理念的企业级知识库引擎架构，这套架构区别于传统的RAG以及一般类RAG，它可以作为一个企业的“知识库中台”来使用同时可以做到零幻觉，是一个企业落地AI的基本要素也是必要前提，文中介绍和总结了大量之前教程中的案例总归纳出了一套完整的企业级精准RAG架构设计最佳实践。

2025-05-19 22:03:46 595

原创 AI量化交易是什么？它是如何重塑金融世界的？

量化交易正以前所未有的速度改变金融市场的运作方式。它依赖数学模型、统计分析和计算机算法，在毫秒级时间内完成交易决策，极大提升了交易效率与精准度。从数据挖掘到模型构建，从算法优化到实时执行，每一个环节都蕴含着科技与金融的深度融合。本文将深入探讨量化交易的核心要素，解析其背后的算法逻辑，并结合实际案例展示它如何在现代投资中发挥关键作用。

2025-05-19 14:31:14 1540

原创 Qwen上线的新功能-深度检索-比发布一个大模型还有用

Qwen上线的Deep Research功能，以深度检索为核心，重构了信息处理逻辑。相比传统大模型的泛化输出，其通过任务拆解、多源整合与动态优化，将复杂研究压缩至数十分钟完成。实测显示，该功能在生活决策、学术辅助及内容创作领域表现突出，但冗长报告中的有效信息密度仍待提升。对比竞品，Qwen更侧重信息筛选的精准性，而Manus等产品则偏向任务互动性。这一突破标志着AI从“生成内容”向“解决问题”的关键进化。

2025-05-19 14:23:28 669

原创 AI Agent开发第70课-彻底消除RAG知识库幻觉(4)-解决知识库问答时语料“总重复”问题

每次如果问同一个问题为什么总时回答同样的那几条从知识库内带出的内容？这同样也属于AI幻觉的一类，在今天的教程中我们就要解决这种问题。

2025-05-18 21:09:18 213

原创继MCP、A2A之上的“AG-UI”协议横空出世，人机交互迈入新纪元

AG-UI（Agent User Interaction Protocol）作为新一代AI交互协议，旨在解决智能体与用户界面间的标准化通信难题。相较于MCP与A2A，AG-UI更专注于人机交互层的优化，通过流式事件传输实现高效、低延迟的用户体验。它的出现，不仅填补了AI生态链的关键空白，更为开发者提供了一种通用的“语言”，让智能体与前端应用无缝衔接，推动AI应用进入全新阶段。

2025-05-18 15:59:38 1132

原创 AI Agent开发第69课-彻底消除RAG知识库幻觉(3)-手撕“重排序”

在上几篇“彻底消除 RAG知识库幻觉”系列中我们提到了这么一个公式：你的搜索内容必须>=用户的提问。要求召回率越大、越多越好。但是这依然不能解决大模型的“过度拟合”问题。因为当喂给大模型的知识库条目内容越多，大模型反而越回答了不好，它会回答一些不相关的内容甚至是“张冠李戴”，因此今天我们要讲在RAG里当召回率高、数据量大时如何把回答的范围“缩”到尽量贴近用户的提问范围内的技巧，这就是“重排序”，又称为Re-ranking。

2025-05-17 19:02:11 283

原创大数据会被AI取代？不！大数据才是AI的“智慧燃料”引擎

AI的发展依赖于大数据，而非取而代之。两者如同引擎与燃料，缺一不可。AI让数据价值更易感知，大数据则赋予AI深度与广度。未来，它们将共同构建智能世界的核心架构。

2025-05-17 13:29:48 691

原创 AI Agent开发第68课-彻底消除RAG知识库幻觉(2)-喂饭式教你多路召回怎么做

多路召回，这一搜索与推荐系统的核心技术，犹如数字世界的智能筛选器。本文深入剖析其工作原理、应用场景与技术演进，从理论到实践全方位解读这一技术如何通过多维度筛选，让AI系统既能应对海量数据挑战，又能满足个性化需求，同时最大化增加召回率，从而让你的AI Agent不会老漏东西、更贴切的召回符合用户的数据。

2025-05-16 19:13:47 231

原创 AI落地困局：卡在试用与变现的夹缝中挣扎破茧

AI技术看似遍地开花，却在商业化的最后一公里频频熄火。从工厂误判率飙升的质检系统，到便利店算不清账的客流监控，企业为AI掏钱时总在犹豫。技术脱离场景、数据杂乱无章、成本收益倒挂，这场“试用容易收钱难”的困局背后，藏着AI落地必须跨越的三重天堑。

2025-05-16 14:12:33 666 1

原创极简主义AI Agent落地思想：Anthropic工程师教你打造高效智能体

Anthropic团队揭示构建AI Agent的黄金法则：聚焦核心场景，保持架构极简，代入Agent视角优化决策。本文通过金融、编程等场景对比，解析Agent系统演进路径，提供从设计到落地的实用方法论，助你避开“万能机器人”陷阱，让AI真正创造价值。

2025-05-16 13:52:18 644

原创智脑进化：神经网络如何从单层感知机迈向深度学习新纪元

本文从生物神经元的协同智慧出发，追溯感知机的诞生与局限，揭示多层网络如何突破线性边界，通过前向传播与反向传播实现智能跃迁。结合大数据与算力革命，剖析深层结构在图像识别、自然语言处理等领域的突破性应用，同时直面过拟合与可解释性等挑战，为中国AI发展喝彩。

2025-05-16 13:07:22 913 2

通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力的sample工程

该Sample工程为通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力一文中所用的例子。它是基于ibm compute grid的批处理开发框架v.6.1.1.1.1基础上来开发的。包含有用于读的样本文本文件、源代码与相关配置。

2013-01-15

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子，内含maven的pom.xml文件与build.xml

2012-12-03

通向架构师的道路第十八到第二十三天的例子

2012-12-02

maven-ant-tasks-2.1.3.jar

2012-11-19

SSH_Alpha工程人附属lib包

通向架构师的道路（第十八天）万能框架Spring(一）教程所属相关工程，大家可以下载下来后导入eclipse用，相关的lib目录下的jar文件已经删了，大家可以自行去下载spring3, struts1.3, hibernate3与jasypt，这些网上都是公开和免费的。我也上传了一份，我本意是大家自己去把这些包整合起来因为我已经发了jar list，不过因为是我整合的，因此收资源分1分

2012-10-22

原版精美通向架构师的道路第十四天至第十七天Word文档

此为本人原版word文档，用于在公司内部作技术强化用，原名为“通向八段的道路”，因为本系列计划想写365天，研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师，自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”，而此次上传的为原版精排版word文档，带有目录和完整正确格式的文档，希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

mod_jk for apache 2.2.x

2012-08-18

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合，但是由于其是从linux/unix下编译过来的，因此它的一些目录与配置文件尚保留着linux/unix下的格式，比如说你装在d:\openssl目录下，它的conf文件内对于内带ca的引用还是/home/democa这样的格式，因此这些目录与资源的引用需要改成windows下的目录和路径相关。为方便大家使用，我已经进行了相关的修改，大家下载此openssl for win后解压后直接在windows环境变量设置相关的： OPENSSL_HOME与openssl_conf 即可使用，为此我收取资源分1点！

2012-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

通向架构师的道路（第二十七天）应用IBM网格计算提高批处理能力的sample工程

通向架构师的道路（第二十五天）SSH的单元测试与dbunit的整合的例子

通向架构师的道路第十八到第二十三天的例子

maven-ant-tasks-2.1.3.jar

SSH_Alpha工程人附属lib包

原版精美通向架构师的道路第十四天至第十七天Word文档

mod_jk for apache 2.2.x

openssl for win

IBM RAD7.5开发指南part3(全图文教程,超灵)

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM RAD7.5开发指南part1(全图文教程,超灵)

Experience J2EE! Using WebSphere Application Server V6.1

高杰的JBPM从入门到精通

fox999_workflow_features_2004A

ibatis 开发指南

jbossgettingstart

hypersonic

spring in action

空空如也