自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

炼丹上岸

一个干AI应用开发的小牛马,给大家分享我的学习历程,欢迎大家一起学习一起努力

  • 博客(349)
  • 收藏
  • 关注

原创 大语言模型智能体架构深度解析:为什么必须通过 Tool Result 注入外部数据而非篡改 System Prompt

摘要: 大语言模型(LLM)智能体设计中,工具执行结果(Tool Result)不应直接拼接至系统提示词(System Prompt),而是需通过标准 tool_result 注入。这一架构原则基于以下核心原因: 分词器与注意力机制:系统提示词和工具结果在底层分词时被赋予不同控制词元,动态拼接会破坏指令层次结构,导致认知过载; KV缓存与成本优化:修改系统提示词会破坏缓存前缀匹配,显著增加延迟和计算成本; 安全性:工具结果隔离可防御提示词注入攻击,避免外部数据获取“Root权限”; 可观测性:结构化工具流支

2026-03-17 16:07:17 320

原创 Ralph 架构深度解析报告:自主代理循环与软件工程的确定性重构

《Ralph架构:AI自主编程的范式革新》摘要 Ralph架构代表AI辅助编程从"副驾驶"到"自主代理"的范式转移。该开源架构通过无限循环和即时反馈机制,使AI能独立完成需求分析、编码、测试到提交的全流程。其核心创新包括: 1)"Human-on-the-loop"模式,人类仅定义标准而非干预过程 2)清洁上下文理论,每次迭代都重置环境避免污染 3)确定性笨拙策略,通过低成本试错实现最终正确性 4)严格背压机制,依赖编译器和测试保证质量 架构包含状

2026-02-03 12:40:31 860

原创 构建下一代语境感知型 AI Agent:AGENTS.md 与 SKILL.md 发现系统的深度工程架构报告

摘要: Agent技术正从对话式转向自主行动能力,其效能核心在于项目语境获取。行业通过标准化协议解决"语境孤岛"问题:AGENTS.md定义治理规则(宪法),SKILL.md封装可执行能力(技能包)。报告详细解析了构建此类Agent的完整技术路线,包括文件系统遍历、AST解析、MCP协议沙箱执行等核心模块。对比主流方案(OpenAI/Anthropic/Cursor)后提出四层架构:发现引擎→认知解析→语境管理→执行运行时,强调安全隔离与动态Prompt构建。未来将向自我进化型Agent

2026-02-03 09:42:24 924

原创 现代文件上传架构权威指南:从二进制流到分布式对象存储的深度剖析

《文件上传技术的深度解析与架构设计》摘要:本文深入探讨了文件上传在互联网基础设施中的复杂性与技术挑战。从HTTP协议层分析了传统编码方式的效率瓶颈,详细解读了multipart/form-data标准及其边界检测算法。重点阐述了服务器端流式处理架构设计,包括内存管理优化、TCP背压机制和无磁盘透传模式。同时探讨了文件格式路由策略、安全威胁防御机制,以及分布式存储环境下的高可用架构设计。通过显微镜级别的技术剖析,揭示了现代文件上传系统在网络协议、二进制流处理、安全防御等方面的核心原理与最佳实践。

2026-02-02 17:48:34 1000

原创 权威指南:企业级文档权限管理架构深度解析——从 ACL 到 RBAC 及未来的演进

摘要 本文系统探讨了企业文档权限管理的技术演进与核心机制。从基础权限三要素(主体、客体、操作)出发,深入剖析了ACL与RBAC两大模型的原理及实现:NTFS通过安全描述符和ACE实现精细控制但面临管理复杂性;Linux ACL创新引入掩码机制;而RBAC通过角色抽象层解决了大规模权限管理难题。文章对比了不同模型在颗粒度、扩展性与管理成本间的权衡,揭示了现代企业权限体系从直接控制向间接管理的演进趋势,为零信任架构的实施提供了理论基础。

2026-02-02 17:46:20 679

原创 对象存储架构演进与AI大模型时代的深度融合:从S3基础到万亿参数训练的技术全景

摘要: 生成式AI和大语言模型的爆发推动云计算基础设施转向对象存储(如Amazon S3),其无限扩展性和扁平化命名空间更适配AI工作负载的I/O特征。相比传统块存储和文件存储,对象存储解决了海量小文件的元数据瓶颈,并通过强一致性模型支持分布式训练。报告深入解析了S3的架构创新,包括存储分层、智能生命周期管理及低延迟的S3 Express One Zone,并探讨了其在AI数据管道中的实践,如数据摄取优化和训练检查点管理。对象存储已成为AI数据基础设施的核心底座。

2026-02-02 17:29:27 843

原创 从「文件URL」到「模型可理解内容」:一套完整的文件上传与解析处理流程详解(含PDF/Excel/图片)

本文详细拆解了从文件URL到AI模型可理解内容的完整处理流程。核心步骤包括:1) 文件下载获取二进制数据;2) 通过文件类型识别选择合适解析器;3) 将不同格式文件转换为模型可处理的文本或Base64格式;4) 根据内容类型自动切换文本或多模态模型。文章特别强调了工程实现中的关键点:并行处理提升I/O效率、临时文件管理、安全校验机制,以及针对PDF/Excel/Word/图片等不同格式的解析策略。该流程为构建RAG、文档问答等AI应用提供了标准化的文件处理范式。

2026-01-22 16:47:45 1195

原创 现代数据库系统全景深度研究报告:从理论范式到分布式架构的演进与实践

数据库系统演进与技术解析 本报告系统梳理了数据库管理系统的完整发展历程与技术架构。从早期的打孔卡机械数据处理到现代云原生数据库,报告详细分析了关系型数据库的数学基础(关系代数与规范化理论)、事务处理机制(ACID特性与隔离级别),以及非关系型数据库在CAP定理下的设计权衡。重点探讨了B+树与LSM树等存储引擎的核心数据结构,分布式共识算法(Paxos/Raft)的实现原理,以及向量数据库、时序数据库等新型数据库的技术特点。通过对数据库系统理论深度与工程实践的全面剖析,为理解现代数据基础设施提供了系统性的知识

2026-01-19 17:58:44 990

原创 企业级 AI 系统分层存储架构深度研究报告

摘要 随着大语言模型(LLM)与检索增强生成(RAG)技术的普及,企业数据架构面临新挑战。本文分析了传统"All-in-Postgres"架构在处理亿级数据时的性能瓶颈,提出多层持久化架构(Polyglot Persistence)解决方案。该架构通过精确分工实现优化: 关系型数据库(PostgreSQL/MySQL)作为控制平面,负责元数据管理和ACID事务 向量数据库(Milvus/OpenSearch)专注高维向量检索,采用HNSW图算法 内存存储(Redis)处理低延迟会话状态

2026-01-19 17:02:12 902

原创 PostgreSQL 高维向量存储架构深度解析:架构限制、核心原理与行业解决方案

摘要:高维向量存储与检索的优化策略 随着大语言模型(LLM)的发展,向量维度从384维(BERT)扩展到4096维(Mistral/Llama),对传统数据库存储架构提出了挑战。PostgreSQL的pgvector扩展面临2000维的物理限制,这源于其8KB页面结构和索引存储机制。 报告分析了2000维限制的底层原因:PostgreSQL索引条目必须完整存储在单个页面内,而高维向量会超出8KB容量。虽然TOAST机制允许存储高维数据,但索引需要直接访问完整向量,导致性能瓶颈。 行业解决方案包括: 标量量化

2026-01-19 15:41:43 846

原创 LangChain 架构深度解析:从中间件机制到人机协同 SQL 智能体实战报告

摘要 随着大语言模型从确定性链条向概率性智能体演进,AI应用开发面临非确定性输出、资源消耗和安全风险等挑战。LangChain通过中间件架构和人机协同机制,为企业级智能体提供了标准化解决方案。报告深入解析了中间件的生命周期管理、拦截钩子设计及状态/上下文管理机制,详细介绍了内置中间件功能如对话摘要、资源限流、敏感信息检测等的最佳实践。通过构建具备生产级安全防护的SQL智能体案例,展示了如何将理论转化为工程实践,有效解决数据库查询中的幻觉和破坏性操作风险。

2026-01-12 18:58:12 1081

原创 Git Worktree 终极指南:解锁多 AI 并行开发的“影分身”之术

摘要:本文介绍如何利用Git Worktree实现多AI并行开发,解决传统Git流程中频繁切换分支和代码冲突的问题。通过抖音视频提取工具案例,演示了如何为不同AI任务创建独立工作目录(Worktree)和分支,实现物理隔离开发。关键优势包括:真并行开发能力、毫秒级上下文切换、环境隔离等。文章还提供了具体操作步骤、避坑指南和最佳实践,如命名规范、依赖管理注意事项等。这种"Human-in-the-loop"模式让开发者作为架构师坐镇主分支,多个AI在不同Worktree中并行推进任务,大幅

2026-01-09 23:42:34 1457

原创 深度解析:FFmpeg 远程流式解复用原理与工程实践

摘要:MP4容器格式与流式传输的底层机制 本文深入剖析了MP4容器格式(ISO BMFF)实现流式传输的核心原理。首先明确了编码流与容器格式的本质区别:编码流(H.264等)只处理压缩数据,而容器格式(如MP4)则负责组织索引、同步和时间映射。重点解析了MP4的盒子结构,特别是moov盒子中的样本表系统,包括stts(时间到样本映射)、stss(关键帧定位)、stsc(样本块映射)等关键索引表,这些构成了从逻辑时间到物理偏移量的精确转换机制。通过这种精密的索引结构,FFmpeg等播放器无需下载完整文件即可实

2026-01-09 23:38:39 1129 1

原创 2025年大语言模型技术全景报告

2025 年最大的技术突破在于模型训练范式的根本性转移:从单纯追求更大的预训练语料库(Pre-training Scaling),转向利用强化学习(RL)来提升模型的推理能力,即**“推理扩展”(Inference Scaling)**。的技术路线,使得模型在回答问题前能够进行思维链(Chain of Thought, CoT)的自我博弈与验证,从而在根本上解决了数学、编码和复杂逻辑领域的诸多痛点,将 AI 从一个“概率性的文本生成器”升维为一个“具备逻辑验证能力的推理引擎”。

2026-01-07 18:09:14 981

原创 掌握 Claude Code:从创意到发布,构建 MVP 的 PSB 系统

《AI编程三阶段法:PSB系统高效构建Claude Code项目》摘要:本文介绍了Avthar提出的PSB系统(规划-设置-构建),帮助开发者利用Claude Code高效构建项目。规划阶段强调明确目标、分解里程碑并创建详细规格文档;设置阶段提供7步配置清单,包括GitHub仓库、环境变量、文档自动化等;构建阶段介绍三种工作流(通用模式、基于Issue模式和多智能体模式)及生产力技巧。该系统通过结构化流程,能显著提升AI辅助编程效率,减少返工,适合从新手到资深开发者使用。

2026-01-07 18:05:39 1159

原创 代理式 CI/CD 的崛起:Claude Code Action 深度技术分析报告

摘要: Claude Code Action 代表 CI/CD 从静态流水线向代理式智能(Agentic CI/CD)的范式转变,具备自主代码生成、验证与迭代能力。其架构采用容器化代理模型,在本地执行核心逻辑,通过 API 调用云端推理,支持交互式(ChatOps)与全自动模式。关键优势包括主动检索上下文、长期记忆管理(CLAUDE.md)和 OIDC 安全认证。相比竞品,它以通用代理定位实现强执行能力,但需注意成本控制与安全治理。建议企业分阶段部署,结合零信任原则优化上下文工程。 (149字)

2026-01-06 14:50:50 1031

原创 OpenAI Realtime API 深度技术架构与实现指南——如何实现AI实时通话

OpenAI Realtime API实现了AI交互从传统请求-响应到流式多模态的范式转变,通过WebSocket/WebRTC提供毫秒级延迟的实时对话体验。其核心创新包括:1)有状态会话模型实现上下文持久化;2)原生多模态处理消除级联架构延迟;3)灵活的话轮控制机制支持打断功能。技术规范涵盖音频编码标准(24kHz PCM)、事件驱动协议和成本优化策略,为开发者构建实时语音AI应用提供了完整框架。该架构将AI从指令执行者升级为具备实时感知能力的对话伙伴,标志着人机交互的新阶段。

2025-12-30 10:30:06 920

原创 我开源了一个新项目,notes-on-llms——一个从「模型原理 → 训练 → 推理 → Agent → 安全 → 多模态」系统拆解大语言模型的知识仓库(2)

《构建LLM系统性认知框架:notes-on-llms仓库介绍》针对当前大语言模型学习中碎片化知识泛滥的问题,提出了一个全景式技术栈解决方案。该开源仓库从工程架构视角系统梳理了LLM七大核心模块:基础原理、训练流程、推理优化、提示工程、智能体系统、安全对齐及多模态扩展,强调技术模块间的关联性而非单点知识。区别于常见教程,该项目定位为可持续更新的技术参考手册,适合已具备LLM基础、需建立完整技术框架的开发者。作者通过博客与仓库互补的形式,为从业者提供从原理理解到工程实践的系统性认知地图。

2025-12-27 16:43:06 769

原创 【2025 年度总结】处世界变革之际,深耕AI技术,踏时代之潮流 :从 RAG 落地到多智能体协同的技术突围 | 博客之星 2025 年度评选

2025年AI技术回顾与个人成长总结 2025年,大语言模型(LLM)技术持续突破,推动AI从理论研究走向产业落地。作者从计算机视觉(CV)转向NLP领域,亲历了技术浪潮的演进:从初探DeepSeek部署的迷茫,到掌握Ollama本地化部署、vLLM企业级优化等全栈解决方案。 技术探索聚焦两大核心: Tokenizer底层研究:剖析分词机制对模型性能的影响,开源Genesis-LLM工具包,解决专业领域词表扩展问题。 RAG系统优化:从基础检索进阶到智能代理架构(Agentic RAG),通过混合检索、上下

2025-12-27 11:41:27 1860

原创 我开源了一个新项目,notes-on-llms——一个从「模型原理 → 训练 → 推理 → Agent → 安全 → 多模态」系统拆解大语言模型的知识仓库

《构建LLM系统性认知框架:notes-on-llms技术仓库介绍》摘要 针对当前大语言模型(LLM)学习资源零散化与实践需求系统化之间的矛盾,作者创建了开源知识仓库"notes-on-llms"。该仓库突破单点知识局限,采用工程架构视角系统梳理LLM技术栈,涵盖模型原理、训练流程、推理优化、Agent系统、安全对齐及多模态等核心模块。区别于碎片化教程,该项目强调技术模块间的关联性,如训练阶段的角色分工、推理性能瓶颈等工程实践关键问题。仓库持续更新维护,既可作为技术参考手册,也与作者博客

2025-12-24 14:47:47 896

原创 深度解析DeepSeek大语言模型架构演进——从多头注意力机制到 DeepSeek 核心技术体系 (DeepSeek-MoE, MTP, MLA)

摘要: DeepSeek系列大模型通过三大核心技术突破传统LLM的显存与效率瓶颈: 多头潜在注意力(MLA):采用低秩压缩KV Cache,显存占用接近MQA,性能保留MHA优势,兼容解耦RoPE; DeepSeek-MoE:细粒度专家分割(256路由专家)与共享专家隔离,解决知识冗余,提升参数效率; 多Token预测(MTP):训练时并行预测未来token增强梯度信号,推理时可作草稿模型加速2倍。 结合FP8训练与DualPipe流水线优化,实现高效能模型设计,为千亿级大模型提供可扩展方案。

2025-12-24 14:45:38 978

原创 大语言模型混合专家(MoE)架构深度技术综述

摘要: 混合专家(MoE)架构通过稀疏激活机制实现参数与算力的解耦,成为千亿级大模型的核心技术。其核心组件包括专家网络和门控机制,采用Top-k路由策略平衡性能与负载。MoE面临训练稳定性、分布式通信瓶颈等挑战,需结合辅助损失函数和并行优化技术。典型模型如Mixtral 8x7B、Grok-1等展示了高参数效率,未来将向端侧部署、异构专家等方向发展。MoE正推动AI从规模扩张转向精细化计算,成为实现万亿参数模型的可行路径。

2025-12-24 14:21:20 1310

原创 Transformer 架构中的位置编码机制深度研究报告

本文系统梳理了Transformer模型中位置编码技术的发展历程与核心方法。从绝对位置编码(正弦编码、可学习嵌入)到相对位置编码(Shaw、Transformer-XL、T5),再到现代主流方案旋转位置编码(RoPE)和线性偏差注意力(ALiBi),详细分析了各类方法的数学原理、特性优劣及适用场景。特别探讨了长上下文扩展技术(NTK、YaRN)和新兴方案(NoPE、CoPE),通过对比表总结各方法在类型、参数量、外推能力等方面的差异。研究表明,RoPE凭借其综合性能成为当前主流选择,而ALiBi在外推性上表

2025-12-24 13:54:42 949

原创 下一代智能代理架构:Agent Skills 与 AGENTS.md 的深度技术解析与生态演进报告

摘要:AI代理架构的范式演进——从提示词工程到AGENTS.md与Agent Skills的协同 本文系统阐述了AI领域从提示词工程向自主代理架构的范式转移。研究聚焦两大关键技术: AGENTS.md:作为上下文治理层,通过标准化Markdown协议解决AI协作中的角色定义、行为边界和操作指令问题,实现透明化人机协作。其层次化解析逻辑特别适合大型单体仓库管理。 Agent Skills:作为能力执行层,采用"代码即工具"理念,通过渐进式披露的三层架构(发现层→指令层→执行层)和沙箱环境,

2025-12-22 14:07:03 1450

原创 我把大语言模型的所有核心模块,整理成了一张“可复用的技术地图”

《系统性拆解大语言模型技术栈:notes-on-llms项目推荐》 该项目提供了一套结构化的大语言模型(LLM)认知框架,将碎片化的技术知识整合为完整系统。文档从模型原理到多模态应用,系统性地拆解了LLM技术栈的六大核心模块:RAG检索增强生成、Agent架构设计、训练与微调系统、Prompt工程、多模态技术以及新兴的MCP范式。 不同于零散的教程,该项目采用"技术地图"的组织方式,着重展现各模块在系统中的位置、职责和连接关系。特别适合已掌握基础LLM知识,希望进阶理解模型系统架构的开发

2025-12-22 08:30:00 807

原创 我把 LLM 技术栈做成了一张“可复用的认知地图”:notes-on-llms 开源仓库介绍

《notes-on-llms:大语言模型结构化知识库》是一个系统性整理LLM技术栈的开源项目,覆盖模型原理、训练范式、推理优化到Agent架构等核心模块。区别于零散资料,该项目采用技术栈拆解方式,提供RAG、Agent、训练微调等8大主题的工程化指南,包括RAG的离线/在线链路设计、Agent系统构成要素、训练工程全景等深度内容。项目持续更新,适合希望从"使用"进阶到"系统理解"LLM的开发者,提供在线阅读和GitHub仓库两种访问方式,欢迎参与共建。

2025-12-21 18:37:10 1501

原创 我如何系统性整理大语言模型:notes-on-llms 仓库介绍

《构建系统性LLM认知框架:notes-on-llms仓库介绍》针对当前大语言模型学习中零散知识与工程需求脱节的问题,推出一个系统性知识仓库。该仓库从模型原理、训练、推理到安全、多模态等7大模块,构建LLM全景技术图谱,强调工程视角而非碎片化信息。适合已具备基础、希望建立完整技术框架的开发者,可作为长期更新的参考手册。仓库与作者博客形成互补,将持续补充新模型和范式,致力于成为LLM领域的结构化知识库。

2025-12-21 18:11:54 849

原创 AI Agent 知识体系全景详解:从理论基石到前沿实践

摘要: 人工智能正从对话式AI向**代理式AI(Agentic AI)**演进,形成以LLM为核心,融合规划、记忆与工具使用的智能体架构。报告系统梳理了AI Agent知识体系,涵盖CoT、ToT、ReAct等规划技术,MetaGPT、AutoGen等多智能体协作框架,以及向量检索、工具调用等模块。同时探讨了安全评测、具身智能(如Minecraft Voyager)等应用,并展望端侧Agent与Agent OS的未来趋势,为AI向自主任务执行迈进提供全景视角。

2025-12-21 17:50:15 755

原创 模型上下文协议 (MCP) 深度技术综述:架构、实现与未来生态

模型上下文协议(MCP)是AI领域的通用接口标准,旨在解决生成式AI模型与外部数据源间的互操作性危机。该协议采用客户端-服务器架构,通过JSON-RPC 2.0实现模型与工具的无缝对接,支持资源、工具和提示词三类核心原语。MCP借鉴USB-C的设计理念,将集成复杂度从M×N降至M+N,并内置安全机制。其开源特性与跨平台支持(包括Google Cloud等主流平台)使其成为AI生态系统的关键基础设施。开发人员可通过Python SDK快速构建MCP服务,实现智能应用的标准化连接。

2025-12-21 17:44:43 1149

原创 大语言模型提示工程全景综述:从上下文学习机制到多模态认知架构与安全防御体系

摘要: 提示工程已发展为融合认知科学、计算语言学与安全工程的系统性学科。报告系统解构了其四层架构:基础层(上下文学习ICL与CRISPE框架)、进阶层(思维链CoT与树状推理ToT)、前沿层(自动化提示APE与多模态融合)及安全层(对抗防御与指令层级)。研究表明,千亿参数模型通过非梯度更新的ICL机制实现任务适配,CoT/ToT可提升复杂推理成功率至74%,而指令层级防御能有效抵抗DAN攻击。未来提示工程将向流工程与智能体编排演进,成为AGI系统的核心组件。(149字)

2025-12-21 17:30:22 688

原创 多模态大模型全栈技术深度综述:从底层架构机制到前沿统一范式与工程实践

本报告系统梳理了多模态大模型与生成式AI的核心技术体系。在基础架构方面,详细解析了ViT的Patch Embedding机制、CLIP对比学习目标,以及LLaVA与BLIP-2的模态连接器设计差异。数据工程部分重点阐述了LAION-5B的CLIP过滤策略和ShareGPT4V的高质量标注方法。报告还深入探讨了多模态RLHF对齐、扩散模型架构演进(DiT到SD3)、ControlNet控制技术等前沿方向,并分析了多模态RAG和具身智能的应用实践。最后介绍了Uni-MoE统一架构和vLLM高性能推理等最新进展,

2025-12-21 17:11:14 1787

原创 大语言模型(LLM)全栈技术深度综述:理论、系统与工程实践

本报告系统梳理了大语言模型(LLM)技术栈的最新进展,涵盖架构优化、训练部署和推理加速等关键环节。重点分析了Transformer架构的现代变体(RoPE、ALiBi、GQA)、万亿参数训练技术(3D并行、ZeRO优化)、高效微调方法(LoRA、QLoRA)以及推理优化方案(FlashAttention、投机采样)。报告还深入探讨了数据工程流程和人类价值观对齐技术(RLHF、DPO),为研究人员和工程师提供了全面技术参考。这些创新显著提升了模型性能、训练效率和推理速度,推动了LLM技术的工业化应用。

2025-12-21 17:02:52 686

原创 检索增强生成(RAG)技术全景:从架构原理到工程实践的深度综述

《RAG技术生态全景报告:从数据准备到检索增强生成》摘要 本报告系统梳理了检索增强生成(RAG)技术生态,揭示其如何通过非参数化记忆解决大语言模型的知识滞后与幻觉问题。核心内容涵盖:1)数据准备阶段的分块策略与多模态处理;2)索引构建中的向量空间优化与树状检索技术;3)主流向量数据库选型指南;4)混合检索、查询重写等优化方法;5)生成阶段的上下文增强与评估体系。报告指出,RAG技术正从朴素架构向模块化代理演进,未来将向多模态融合、知识图谱结合及端侧部署方向发展,成为大模型落地的关键支撑。

2025-12-21 16:44:32 876

原创 下一代 AI 销售陪练系统的架构蓝图与核心技术挑战深度研究报告

摘要: 生成式AI和大语言模型(LLM)正推动销售赋能从静态脚本向动态仿真转变。AI销售陪练系统需解决低延迟、高情商交互及严格遵循销售方法论(如MEDDIC、SPIN)等挑战。报告探讨了级联架构与端到端语音模型的权衡,强调混合架构的可行性;分析了全双工通信、打断处理等实时交互技术;提出基于状态机(FSM)和知识图谱(GraphRAG)的对话管理方案;并构建了自动化评分体系。最终指出,实现亚秒级延迟与类人交互需综合音频工程、实时通信与认知控制技术,未来可结合视觉分析提升沉浸感。 (150字)

2025-12-19 15:10:35 1122

原创 混合搜索中的分数归一化方法深度解析:从 BM25 到 vLLM Cross-Encoder 的 Sigmoid 变换

摘要: 混合搜索中稀疏检索(BM25)与稠密向量分数的异质性导致融合困难。本文对比了最大最小归一化(Min-Max)与Sigmoid变换的优劣,指出Min-Max对离群值敏感且易丢失语义信号,而Sigmoid通过非线性映射提供鲁棒的概率校准,尤其适用于vLLM框架下Cross-Encoder输出的Logits转换。Sigmoid将Logits还原为概率,支持RAG系统的阈值截断和幻觉抑制,是数学上的最优解。工程实践中,动态Sigmoid适用于高精度场景,RRF则提供零样本鲁棒性。正确选择归一化方法可提升混合

2025-12-19 11:40:45 614

原创 异构向量空间失配机制与负余弦相似度的深层拓扑学解析(RAG索引,检索期间embedding模型不一致会带来的后果)

摘要: 本文系统研究了语义检索中向量空间失配导致的负相似度现象。核心发现异构模型(如BERT与RoBERTa混用)会引发高维空间的几何互斥:分词器差异导致随机映射,训练目标不同造成空间利用冲突,各向异性使向量分布呈互斥锥形。数学上,这使点积退化为以0为中心的随机分布,约50%文档呈现负分。解决方案强调模型全生命周期一致性,包括严格版本控制、重建索引及跨模型对齐。研究揭示了语义检索系统底层拓扑结构错位的本质,为工程实践提供了理论依据。

2025-12-19 10:01:33 721

原创 混合检索中短查询高分异常的深度剖析与神经重排序(Rerank)的修正机制研究报告

混合检索系统在短查询场景下存在显著缺陷,导致返回大量不相关文档。研究发现,该问题源于稀疏检索中IDF失效、稠密检索中的各向异性和枢纽点效应,以及融合算法对弱信号的放大。神经重排序(Cross-Encoder)通过早期语义交互和细粒度分析,能有效修正这种系统性错误。研究建议采用两阶段流水线(混合检索+重排序)来平衡精度与效率,这对提升RAG系统质量至关重要。

2025-12-19 09:50:56 754

原创 LangChainv1 Agent 新版教程,与之前大有不同(二)

LangChain Agent 概述与实践指南 LangChain Agent 是一种结合大型语言模型(LLM)与外部工具的高级智能代理系统,能够通过推理、规划和工具调用完成复杂任务。其核心组件包括LLM模型(支持静态/动态选择)、可扩展的工具集(支持错误处理和ReAct循环调用)以及灵活的系统提示词机制。Agent通过AgentExecutor执行,提供结构化输出、记忆状态、流式响应等进阶功能。开发者可自定义Agent模板和工具,并通过中间件实现输入预处理、动态路由等企业级需求。最佳实践建议关注多工具协作

2025-11-29 18:06:31 1011

原创 大语言模型词表构建技术的深度剖析:从原理重构到词表扩充的工程实践(二)

摘要: 大模型架构中,词表构建(Tokenization)是连接自然语言与机器计算的离散化基石。现代大模型普遍采用子词切分算法(如BPE、Unigram),但通用词表在垂直领域表现不佳。词表重构需通过数据准备、预分词、SentencePiece训练等步骤实现,并评估压缩率与Rényi熵。词表扩充则需合并增量词表、调整模型嵌入层,并采用均值初始化策略优化新增权重。持续预训练是赋予新token语义的关键步骤,需平衡新旧语料比例以避免遗忘。

2025-11-29 18:04:24 968

原创 我新开源了一个项目,Genesis-LLM帮助大家快速复用大语言模型训练脚本,小白快速入门!(二)

Genesis-LLM是一个开箱即用的中文/领域大模型训练全流程工具包,提供从数据预处理到模型部署的完整解决方案。该项目整合了数据处理管线、词表扩充、高效微调(LoRA/QLoRA)、RLHF对齐(DPO/PPO)等核心功能,支持vLLM高性能推理和llama.cpp边缘部署。通过YAML配置驱动和实验追踪集成,帮助开发者快速复用训练脚本,避免重复造轮子。适用于LLM初学者学习全流程、算法工程师快速实验调优以及研究人员探索不同训练策略,显著降低大模型训练门槛。

2025-11-29 18:03:40 928

5.图像分类算法原理与实战.pptx

第 1 章 计算机视觉概述 计算机视觉是深度学习领域最热门的研究领域之一,已经被广泛应用在了各个领域,那么它是如何发展至今的呢?本章主要阐述了计算视觉的发展历程,并对计算机视觉领域的主要任务进行概述,挑选了一些典型的视觉应用案例让读者深入了解计算机视觉在智慧城市、农业、能源电力、农业和自动驾驶等不同领域所发挥的作用。然后还介绍了常用的计算机视觉处理工具,比如opencv等,以方便读者使用。最后对计算机视觉当下与未来的发展进行了展望。 学完本章,希望读者能够掌握以下知识点: 了解计算机视觉的发展历程。 熟悉计算机视觉领域的主要任务和应用场景。 认识计算机视觉常用的处理工具。 第 2 章 深度学习开发框架 深度学习开发框架在深度学习项目开发中起着重要作用。本章介绍了目前国内深度学习项目开发领域中应用的三个主流深度学习开发框架。由于本书各章节示例代码中使用的是飞桨框架,所以,本章重点介绍了飞桨框架。飞桨框架经过多年沉淀已经具备了良好的性能和非常友好的用户体验。学完本章,希望读者能够掌握以下知识点: 了解使用深度学习框架的意义; 了解三大框架分别是什么及其基本功能;

2023-10-02

4.深度学习网络模型.pptx

第 1 章 计算机视觉概述 计算机视觉是深度学习领域最热门的研究领域之一,已经被广泛应用在了各个领域,那么它是如何发展至今的呢?本章主要阐述了计算视觉的发展历程,并对计算机视觉领域的主要任务进行概述,挑选了一些典型的视觉应用案例让读者深入了解计算机视觉在智慧城市、农业、能源电力、农业和自动驾驶等不同领域所发挥的作用。然后还介绍了常用的计算机视觉处理工具,比如opencv等,以方便读者使用。最后对计算机视觉当下与未来的发展进行了展望。 学完本章,希望读者能够掌握以下知识点: 了解计算机视觉的发展历程。 熟悉计算机视觉领域的主要任务和应用场景。 认识计算机视觉常用的处理工具。 第 2 章 深度学习开发框架 深度学习开发框架在深度学习项目开发中起着重要作用。本章介绍了目前国内深度学习项目开发领域中应用的三个主流深度学习开发框架。由于本书各章节示例代码中使用的是飞桨框架,所以,本章重点介绍了飞桨框架。飞桨框架经过多年沉淀已经具备了良好的性能和非常友好的用户体验。学完本章,希望读者能够掌握以下知识点: 了解使用深度学习框架的意义; 了解三大框架分别是什么及其基本功能;

2023-10-02

3.深度学习算法基础.pptx

第 1 章 计算机视觉概述 计算机视觉是深度学习领域最热门的研究领域之一,已经被广泛应用在了各个领域,那么它是如何发展至今的呢?本章主要阐述了计算视觉的发展历程,并对计算机视觉领域的主要任务进行概述,挑选了一些典型的视觉应用案例让读者深入了解计算机视觉在智慧城市、农业、能源电力、农业和自动驾驶等不同领域所发挥的作用。然后还介绍了常用的计算机视觉处理工具,比如opencv等,以方便读者使用。最后对计算机视觉当下与未来的发展进行了展望。 学完本章,希望读者能够掌握以下知识点: 了解计算机视觉的发展历程。 熟悉计算机视觉领域的主要任务和应用场景。 认识计算机视觉常用的处理工具。 第 2 章 深度学习开发框架 深度学习开发框架在深度学习项目开发中起着重要作用。本章介绍了目前国内深度学习项目开发领域中应用的三个主流深度学习开发框架。由于本书各章节示例代码中使用的是飞桨框架,所以,本章重点介绍了飞桨框架。飞桨框架经过多年沉淀已经具备了良好的性能和非常友好的用户体验。学完本章,希望读者能够掌握以下知识点: 了解使用深度学习框架的意义; 了解三大框架分别是什么及其基本功能;

2023-10-02

2.深度学习开发框架.pptx

第 1 章 计算机视觉概述 计算机视觉是深度学习领域最热门的研究领域之一,已经被广泛应用在了各个领域,那么它是如何发展至今的呢?本章主要阐述了计算视觉的发展历程,并对计算机视觉领域的主要任务进行概述,挑选了一些典型的视觉应用案例让读者深入了解计算机视觉在智慧城市、农业、能源电力、农业和自动驾驶等不同领域所发挥的作用。然后还介绍了常用的计算机视觉处理工具,比如opencv等,以方便读者使用。最后对计算机视觉当下与未来的发展进行了展望。 学完本章,希望读者能够掌握以下知识点: 了解计算机视觉的发展历程。 熟悉计算机视觉领域的主要任务和应用场景。 认识计算机视觉常用的处理工具。 第 2 章 深度学习开发框架 深度学习开发框架在深度学习项目开发中起着重要作用。本章介绍了目前国内深度学习项目开发领域中应用的三个主流深度学习开发框架。由于本书各章节示例代码中使用的是飞桨框架,所以,本章重点介绍了飞桨框架。飞桨框架经过多年沉淀已经具备了良好的性能和非常友好的用户体验。学完本章,希望读者能够掌握以下知识点: 了解使用深度学习框架的意义; 了解三大框架分别是什么及其基本功能;

2023-10-02

计算机视觉-飞桨深度学习实战-学习ppt-1

第 1 章 计算机视觉概述 计算机视觉是深度学习领域最热门的研究领域之一,已经被广泛应用在了各个领域,那么它是如何发展至今的呢?本章主要阐述了计算视觉的发展历程,并对计算机视觉领域的主要任务进行概述,挑选了一些典型的视觉应用案例让读者深入了解计算机视觉在智慧城市、农业、能源电力、农业和自动驾驶等不同领域所发挥的作用。然后还介绍了常用的计算机视觉处理工具,比如opencv等,以方便读者使用。最后对计算机视觉当下与未来的发展进行了展望。 学完本章,希望读者能够掌握以下知识点: 了解计算机视觉的发展历程。 熟悉计算机视觉领域的主要任务和应用场景。 认识计算机视觉常用的处理工具。 第 2 章 深度学习开发框架 深度学习开发框架在深度学习项目开发中起着重要作用。本章介绍了目前国内深度学习项目开发领域中应用的三个主流深度学习开发框架。由于本书各章节示例代码中使用的是飞桨框架,所以,本章重点介绍了飞桨框架。飞桨框架经过多年沉淀已经具备了良好的性能和非常友好的用户体验。学完本章,希望读者能够掌握以下知识点: 了解使用深度学习框架的意义; 了解三大框架分别是什么及其基本功能;

2023-10-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除