- 博客(381)
- 收藏
- 关注
原创 微服务与领域驱动设计:构建高内聚低耦合系统的指南
领域驱动设计DDD是一种设计思想,它可以同时指导中台业务建模和微服务设计(中台本质是业务模型,微服务是业务模型的系统落地),领域驱动设计强调领域模型和微服务设计的一体性,先有领域模型然后才有微服务,而不是脱离领域模型来谈微服务设计。
2020-03-26 18:34:46
1770269
1998
原创 深入解析Spring Cloud Config:多样配置中心的实现与高可用策略
这篇文章探讨了配置中心的重要性及其在分布式系统中的应用,特别关注Spring Cloud Config。文章首先介绍了配置中心的由来、功能及选择标准,然后详细阐述了Spring Cloud Config的基本实现方法,包括结合Git、关系型数据库(MySQL)和非关系型数据库(MongoDB)的方案。此外,还讨论了配置中心的高可用性、客户端自动刷新机制及安全认证等扩展功能。最后,文章对比了Spring Cloud Config与Apollo的特性,强调Apollo在企业级应用中的优势。
2019-02-14 14:36:20
1686968
2707
原创 深入理解服务发现与注册:从单体架构到微服务时代的演进
本文首先回顾了服务发现与注册技术在不同系统架构时代的应用演进,分析了单体架构、SOA架构和现代微服务架构下的实现方式和挑战。随后,文章详细介绍了服务发现与注册的技术选型,并深入探讨了Eureka作为一种基于AP原则的服务注册中心的设计理念,包括其如何解决服务实例注册、剔除和信息一致性问题。接着,本文分析了Eureka的基本架构和细化结构,包括注册中心服务器、服务提供者和消费者的角色和功能。最后,文章讨论了Eureka的高可用方案、区域亲和性以及参数调优与监控策略,帮助读者更好地理解和应用这一关键技术组件来构
2019-02-14 14:28:33
1691438
1426
原创 大模型时代的视觉 Transformer-ViT 为什么需要大规模训练集?
本文围绕“ViT为何需要大型训练集”展开,拆解视觉Transformer的数据饥饿问题。文章从CNN与ViT的归纳偏置差异切入,说明ViT缺少局部性、平移等变性和层级结构等视觉先验,因此更依赖海量样本去学习图像规律。结合ViT、DeiT、Swin、BEiT等代表性研究,文章分析数据增强、知识蒸馏、自监督预训练、优化器与架构改进如何降低数据需求。最终指出,大训练集并非ViT成功的唯一条件,关键在于用数据、预训练和训练策略补足视觉先验,从而释放其可扩展能力。
2026-06-21 12:13:47
2695
原创 大模型评估中合适的模型度量思考梳理分析
大模型评估的关键不是追求单一高分,而是选择能反映真实目标的度量。不同任务应使用不同指标:分类看 Accuracy、F1、MCC;概率输出看 Log Loss、Brier 和校准;生成任务不能只看 BLEU/ROUGE,还要结合语义指标、人工偏好和安全评测;检索与 RAG 则需关注 Recall@k、MRR、NDCG 及最终答案质量。合适的模型度量,本质上是把业务目标、错误代价、用户体验和上线风险转化为可比较的数字。
2026-06-21 12:04:11
2587
原创 多GPU训练模式深度调研分享
本文系统梳理大模型多GPU训练模式,从数据并行、张量并行、流水线并行到ZeRO/FSDP与混合并行,直观解释模型参数、梯度、激活值和优化器状态如何在多卡间切分、通信与同步。文章结合图解展示不同方案的工作流、显存占用、通信瓶颈和适用场景,帮助读者快速理解为什么单卡装不下大模型,以及如何通过多GPU协同提升训练效率。
2026-06-20 18:01:37
2977
原创 大模型中的自注意力与其变种梳理整合分享
本文用统一框架快速梳理大模型中的自注意力及其变种:从 Q/K/V、多头注意力、因果掩码出发,解释位置编码、RoPE、ALiBi、稀疏注意力、线性注意力、低秩近似与 FlashAttention。核心是理解三件事:谁能看谁、如何表达位置、怎样算得更省,从而建立选型直觉。
2026-06-20 17:35:08
2749
原创 大模型中通过改进模型减少过拟合调研
通过参数共享、瓶颈结构、Adapter、LoRA、QLoRA、Prompt Tuning、MoE 稀疏激活等方法,模型可以保留预训练获得的通用能力,同时减少对训练集噪声的记忆。文章结合 Dropout、AdamW、Label Smoothing、MixUp、Early Stopping 等策略,说明如何从结构设计、参数高效微调和训练控制三方面提升泛化能力。整体强调:先用预训练与参数高效微调稳住模型,再用正则化和验证集监控抑制过拟合,最后再考虑剪枝与量化部署。
2026-06-19 20:56:22
2821
原创 大模型LLM ACA - ACP认证考试模拟试卷六答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!!!
2026-06-19 12:12:37
2427
原创 用数据减少大模型过拟合:从“调模型”到“重建训练分布”的工程方法论
本文从数据视角重新审视大模型过拟合问题,指出过拟合并非单纯由模型规模或训练参数导致,而是与数据重复、噪声、标签错误、分布失衡、评测污染和合成数据质量密切相关。文章系统分析了数据影响泛化能力的底层机制,并提出通过数据清洗、去重、增强、重采样、合成数据过滤、半监督学习、数据选择与评估闭环等方法,构建更干净、更均衡、更贴近真实任务的数据体系,从而降低过拟合风险,提升模型泛化能力。
2026-06-16 08:00:00
3232
原创 大模型时代的小样本学习:从“少量标注”到“知识激活系统”
本文围绕大模型时代的小样本学习展开,指出其核心已从“少量样本训练模型”转向“少量样本激活、适配与组织大模型能力”。文章系统分析了 Meta-learning、Prompt Learning、In-context Learning、PEFT 与 RAG 等主要范式,比较其适用场景、工程取舍与局限,并进一步讨论示例敏感、标签偏置、过拟合、检索错配和幻觉等失败模式。最后指出,未来小样本学习将走向多方法融合、外部知识增强、动态更新与可验证部署。
2026-06-15 21:06:07
2723
原创 从嵌入、表征到潜空间:理解大模型向量世界的三种视角
在大模型与现代机器学习中,“嵌入”“表征”“潜空间”常被混用,但它们并不是同一个概念的不同叫法。嵌入关注如何把离散对象映射到连续向量空间,表征关注模型在计算过程中形成的内部状态,潜空间则关注数据背后可生成、可采样、可控制的隐藏因素。本文从概念差异、训练目标、空间几何、评估方法和工程实践等角度出发,系统梳理三者的关系与边界,说明向量空间并非简单的“语义容器”,而是由任务目标和数据分布共同塑造的计算结构。理解这些空间如何形成、如何工作、如何被误读,是理解大模型能力来源与边界的重要入口。
2026-06-15 20:44:59
2602
原创 大模型 AI 随机性的真正来源整体梳理分析
本文拆解大模型“随机性”的来源:它既来自训练中的参数初始化、数据打乱、Dropout 和梯度噪声,也来自推理中的 temperature、top-k、top-p 等采样策略,还受到硬件和计算后端非确定性的影响。文章指出,随机性并非纯粹缺陷,它能带来泛化能力和生成多样性;但若缺乏管理,也会造成结果不可复现和线上排障困难。因此,理解并记录 seed、解码参数、模型版本和系统环境,是让大模型随机性可观察、可解释、可控制的关键。
2026-06-09 22:29:30
5892
原创 Harness 到底指什么:Coding Agent 时代的运行时边界、工程纪律与业务分层
本文讨论 Coding Agent 时代 “Harness” 的含义:它不是业务 spec,也不是模型 API,而是让模型稳定运行的平台代理层,包括上下文、记忆、工具、权限、subagent、hook 和反馈闭环。文章强调,业务工程不应魔改 harness,而应写清楚 workflow、phase contract、tool spec 和 domain knowledge,通过 harness 暴露的原语可靠执行。成熟的 agent 工程,关键是分清平台边界与业务边界。
2026-06-09 00:15:00
6390
原创 LangGraph Tool Calling 入门:从 @tool 到完整调用链
本文从一个最小Tool Calling Agent 入手,讲解LangGraph中工具调用的完整链路:通过@tool将普通 Python函数包装成LLM可识别的工具,如何使用 bind_tools 注册工具,以及LLM如何根据用户问题生成 tool_calls,再由工具节点执行函数并将结果回传给LLM。文章通过加法、乘法和天气查询示例,拆解了 LLM 决策 → 工具执行 → 结果回传 → LLM 总结 的核心循环、关键细节和常见坑,为后续理解 ReAct Agent 和生产级Agent工程打下基础。
2026-06-08 23:34:01
6515
原创 可视化 LangGraph:让你的 AI Agent 图表「看得见」
本文介绍了 LangGraph 中两个重要的可视化与调试工具:draw_mermaid() 和 stream()。前者用于将编译后的 Agent 图导出为 Mermaid 流程图,帮助开发者直观理解节点、普通边、条件边和循环结构;后者用于在运行时逐步观察每个节点的执行结果和 State 变化,方便定位执行路径、状态更新和死循环等问题。文章通过多个示例展示了静态结构图与动态执行链路的区别,并总结了常见坑、工程化实践和生产环境中的调试策略,为后续进入 Tool Calling 阶段打下基础。
2026-06-08 23:10:48
6357
原创 LangGraph从零构建生产级 AI Agent 平台的递进式学习项目
本文介绍了《LangGraph 实战系列》的整体学习路线与项目规划,涵盖 LangGraph 基础、Tool Calling、Memory、Reasoning Agent、Multi-Agent 及生产级 AI Agent 平台构建,帮助开发者从原理到工程化系统掌握 AI Workflow 与 Agent 编排能力。
2026-06-07 13:46:01
6816
原创 LangGraph MessagesState:用 add_messages 优雅管理 LangGraph 多轮对话
MessagesState 是 LangGraph 中专为对话场景设计的状态模型。它通过内置的 add_messages Reducer,实现消息的自动追加、更新和删除,让开发者无需手动维护对话历史。本文结合源码与实战案例,讲解 MessagesState 的工作原理、多轮对话中的历史传递机制,以及生产环境中的最佳实践。通过学习它,你可以更轻松地构建具备上下文记忆能力的 AI Agent。
2026-06-07 13:43:33
6431
原创 LangGraph 条件边:让 AI Agent 学会“做选择”
本文深入解析了 LangGraph 中的 Conditional Edge(条件边)机制,从其产生背景、核心原理到源码实现,再到条件分支、多路路由与循环重试等典型场景进行了系统讲解。通过 Conditional Edge,LangGraph 不再局限于线性工作流,而具备了运行时决策、动态路由和状态驱动执行的能力,这是构建 Agent、审批流、重试机制和复杂工作流的关键基础。掌握 Conditional Edge 后,你将真正迈入 Agent 编排与智能决策流程设计的大门。
2026-06-06 23:18:42
6570
原创 深入 LangGraph State:Reducer 是如何让状态“自动合并”的
本文是 LangGraph 实战第二篇,详解 Reducer 状态合并:默认字段新值直接覆盖,借助Annotated+Reducer可实现数据累加;讲解 Channel 底层原理、源码与三类实战案例,罗列常见踩坑点并给出生产优化方案,区分覆盖 / 累加选型。
2026-06-04 23:26:26
6500
原创 从零认识 LangGraph:用 30 行代码构建你的第一个 AI Graph
本文从 LangGraph 的出现背景出发,结合源码与实战 Demo,讲解了 StateGraph、State、Node、Edge、compile、invoke 等核心机制,并分析常见踩坑与工程化实践,帮助开发者快速建立 AI Workflow 与状态驱动编排的核心认知。
2026-06-03 21:15:00
6513
原创 RAG 2023–2026 全景解读:从检索增强生成到训练内化的技术与工程实践
过去三年,RAG 已从简单的“检索-拼接”流程演化为覆盖检索、生成、训练、评测与系统工程的完整技术栈。文章系统梳理了 RAG 的概念谱系、检索器技术进展(稀疏/稠密/混合、多向量晚交互、图结构)、生成器与训练方法(自反思、长文本处理、检索增强微调)、评估框架,以及代表性论文与工程实践经验。文中还讨论了部署模式选择、索引策略、缓存与成本控制、隐私与安全风险,并展望未来发展趋势,包括证据选择性拒答、冲突处理、结构化检索、记忆系统、可解释性与安全约束,为研究者与工程团队提供全面参考。
2026-05-31 21:07:12
6471
原创 需求洞察与决策指南:三钻模型的实战解析
本文围绕需求分析的核心逻辑展开,系统梳理了从需求收集、需求定义、需求分析到需求排序的完整流程,并结合“三钻模型”构建了一套可落地的产品需求分析方法论。文章重点介绍了用户角色构建、用户故事、需求本质挖掘、需求优先级评估以及战略决策等关键内容,同时融合 KANO、RICE 等经典模型,帮助产品团队在复杂需求中识别真实问题、判断核心价值,并做出更合理的产品决策。适用于产品经理、业务分析师及互联网从业者进行系统化需求分析与产品规划。
2026-05-31 15:50:03
6576
原创 检索增强生成(RAG)系统的基础:全面深入矢量数据库
本文围绕“大模型时代为什么需要向量数据库”这一核心问题,系统性地介绍了向量数据库在 RAG(检索增强生成)体系中的关键作用。文章从 Embedding 向量生成、语义相似度搜索、ANN(近似最近邻)算法,到 BERT 等上下文嵌入模型的原理展开深入讲解,并结合 Pinecone 实战演示,完整梳理了向量数据库在 AI 检索、知识库问答与大模型应用中的工程实践与底层逻辑。通过本文,你将真正理解:为什么向量数据库会成为连接“数据”与“智能”的核心基础设施。
2026-05-30 21:54:26
6446
原创 向量数据库索引结构与 ANN 检索原理详解:Flat / IVF / PQ / HNSW 全解析
在大模型时代,AI 系统越来越依赖从海量数据中快速找到最相关的信息,而向量检索正是其核心技术。本文系统讲解了向量数据库中常用的索引结构及近似最近邻(ANN)算法,包括 Flat、IVF、PQ 与 HNSW,从基本原理、存储方式到检索机制进行了详细分析。通过图示与实例说明,我们展示了每种索引在速度、内存与精度之间的权衡,并重点解析 HNSW 如何借助分层图与跳表实现高效、低延迟的近似搜索。本文旨在帮助开发者和架构师理解向量检索的底层逻辑,并为大规模语义搜索、推荐系统与 RAG 知识库的实践提供理论与工程参考。
2026-05-30 21:51:21
6415
原创 大模型LLM ACA - ACP认证考试模拟试卷五答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!
2026-04-04 15:58:27
6285
1
原创 大模型LLM ACA - ACP认证考试模拟试卷四答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!!!
2026-04-04 13:47:08
6627
1
原创 大模型LLM ACA - ACP认证考试模拟试卷三答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!!!
2026-04-04 13:28:19
6644
原创 大模型LLM ACA - ACP认证考试模拟试卷二答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!!!
2026-04-04 12:43:29
6804
原创 大模型LLM ACA - ACP认证考试模拟试卷一答案参考
模拟考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。答案解析分享!!!
2026-04-04 12:12:49
6836
原创 大模型LLM ACA - ACP认证考试真题冲刺演练五
真题演练包含50道单选题(每题1分)和25道多选题(每题2分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 14:35:43
9021
原创 大模型LLM ACA - ACP认证考试真题冲刺演练四
真题演练包含50道单选题(每题1分)和25道多选题(每题2分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 14:05:12
9116
原创 大模型LLM ACA - ACP认证考试真题冲刺演练三
真题演练包含50道单选题(每题1分)和25道多选题(每题2分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 13:28:37
8978
原创 大模型LLM ACA - ACP认证考试真题冲刺演练二
真题演练包含50道单选题(每题1分)和25道多选题(每题2分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 12:24:02
8939
原创 大模型LLM ACA - ACP认证考试真题冲刺演练一
真题演练包含50道单选题(每题1分)和25道多选题(每题2分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 11:30:34
9082
1
原创 大模型LLM ACA - ACP认证考试模拟试卷十
考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 10:18:07
9408
2
原创 大模型LLM ACA - ACP认证考试模拟试卷九
考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 10:13:48
9129
原创 大模型LLM ACA - ACP认证考试模拟试卷八
考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 10:09:47
9332
原创 大模型LLM ACA - ACP认证考试模拟试卷七
考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 10:04:54
9069
原创 大模型LLM ACA - ACP认证考试模拟试卷六
考试包含70道单选题(每题1分)和30道多选题(每题1分),总分100分,80分及格,考试时长为120分钟。
2026-03-29 10:01:49
9419
赢得签约战:用动态规划优化棒球自由球员选择策略
2024-08-03
BeanFactory内部解析:Spring框架的心脏如何运作
2024-08-03
解读InnoDB数据库索引页与数据行的紧密关联
2024-08-03
存储选型实战:用真实案例教你如何做出最佳存储决策
2024-08-03
揭秘大模型的世界:初步了解人工智能的核心技术
2024-08-03
自动状态管理革命:优化业务流程的智能解决方案
2024-08-03
文档规范的终极指南:大型项目开发中必备的设计文档标准
2024-08-03
从ES的JVM配置起步思考JVM常见参数优化
2024-08-03
没有找到关于“Graph 模型在长对话场景稳定性”的系统评估数据
2025-12-04
任务切分策略依赖提示工程,是否可能引入规划器优化?
2025-12-04
目前的 Retry 机制似乎是静态规则,能否基于反馈自演化?
2025-12-04
LangGraph 是否支持可验证的 Agent Policy Alignment?
2025-12-04
多模态 Node 之间的数据 Schema 缺乏统一标准是否会限制生态扩展?
2025-12-04
长程任务中 Graph 膨胀问题是否存在自动压缩策略?
2025-12-04
RAG 节点是否能成为 Graph Routing 的直接决策信号?
2025-12-04
LangGraph 在长链任务中如何衡量 Step 复杂度 vs Token 成本?
2025-12-04
多 Agent 写共享内存同一 Key 时,LangGraph 是否提供一致性保证?
2025-12-03
Graph 状态在长链任务中如何保证可再现性?
2025-12-03
LangGraph 中 Memory 是否会随执行轮次逐步污染推理?
2025-12-03
当模型给出建议(例如法律文本修改或医学建议)时,如何量化“建议的可采纳性”(actionability)而不仅是语法/可读性?是否能提出界定 actionability 的客观指标并在用户研究中验证?
2025-12-03
是否能提出一个工程化的“可追溯来源标注机制”( provenance)
2025-12-03
大模型在多步推理中输出路径不透明,难以确定正确答案是否因偶然推得,而缺乏稳定复现机制
2025-12-01
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅