AI-大模型的落地之道
文章平均质量分 87
笔者自己于2022年11月开始转型到AI大模型领域的落地,至今为止已经落地了2个垂直领域、4个大型AI项目。人人都在谈AI,可是AI落地怎么落地?难点在哪?有哪些坑?笔记也集自己烧掉了小8位数最终形成的积累分享给社会,因此建此分栏的目的是志在为祖国的AI事业贡献出自己的一力量。
水中飞月
一个始终站在技术前沿的人,喜欢传播最先进的技术和理念。2023年8月落地过全国最早的AI Agent-智能零售导购,在RAG概念出来前就已经落地了2个大中型RAG类企业级项目。国内最早一批AI应用的践行者。本人的座右铭是:帮助企业认识AI,赋能企业。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Midjourney中的垫图、角色一致、风格一致到底区别在哪
一文说清Midjourney中的垫图、角色一致性垫图、风格一致性垫图的区别。原创 2025-01-24 13:07:44 · 1820 阅读 · 0 评论
-
AI时代的程序员,复合型技术大咖该具备哪些本领与魅力?
随着人工智能时代的到来,程序员的角色已经发生了翻天覆地的变化。不再是仅仅懂得编写代码的"码农",如今的程序员要具备更多的素质。他们不仅需要掌握技术,还需要具备运营能力、业务思维、逻辑思考和各种综合软实力。本文深入探讨了AI时代程序员的新要求,与互联网时代的程序员已截然不同。点击了解更多关于AI时代程序员的变革。原创 2024-06-14 14:14:28 · 2060 阅读 · 0 评论
-
将流形理论(Manifold Theory)引入 Embedding 技术与 RAG(检索增强生成)系统的分析框架
本文基于流形理论揭示嵌入本质,解析语义高维分布。结合 Transformer 架构,提出测地线距离与图索引优化策略,解决检索拓扑断裂。实践验证性能提升,展望动态流形与多模态融合,为构建鲁棒 RAG 系统提供几何视角创新路径与实践方案。原创 2026-02-27 16:14:03 · 632 阅读 · 0 评论 -
AI Agent中的 ReAct 和 Ralph Loop对比说明
当 AI 编程工具“以为自己完成了”却没真正完成时,开发者只能手动重试。Ralph Loop 通过外部验证与强制循环,让 AI 持续工作直到任务真正达标,解决了 LLM 自我评估不可靠的核心问题。原创 2026-02-13 15:34:46 · 860 阅读 · 0 评论 -
当被面试管问到:Agent的意图识别如何做到95%准确率?你怎么回答?
达到95%准确率绝非单一技术突破,而是分类体系、数据质量、系统架构、持续迭代四维协同的系统工程。全文结合了智能汽车、电商等场景,分层拆解可落地的关键路径。原创 2026-02-12 16:16:28 · 1292 阅读 · 0 评论 -
记住,生产级RAG的核心不在于“大模型选了好”
RAG 的成败不在大模型,而在系统工程。本文系统拆解生产级 RAG 架构的七大核心环节,揭示为何多数 Demo 级方案无法落地,并给出可工程化的实践路径。原创 2026-02-12 16:02:31 · 626 阅读 · 0 评论 -
整理了一套可落地的RAG分片验证指标体系给到大家
再拍脑袋切块了!本文系统拆解 Chunking 质量验证的三层指标体系——从物理分布到检索效果再到最终答案,手把手教你用数据说话,避免“切得自己都看不懂”的尴尬局面。原创 2026-02-11 21:38:13 · 988 阅读 · 0 评论 -
RAG不是万能的,但没有RAG是万万不能的:8种主流架构全景解析
RAG不是简单“检索+生成”,而是知识与推理的精密耦合。本文系统剖析8种主流RAG架构——从Naive到SFR,揭示其设计逻辑、适用边界与工程权衡,辅以LangChain可运行代码,助你构建真正可靠的知识增强系统。原创 2026-02-11 21:33:31 · 668 阅读 · 0 评论 -
垂域大模型评估不再靠“感觉”:用结构化测试集+自动化打分实现效果可量化
垂域大模型落地难,不在训练而在评估。本文系统讲解如何从非结构化文档一键生成多题型测试集,并结合规则判分与教师模型打分,构建可量化、可对比、可追踪的评估闭环,让SFT/RAG调优效率翻倍。原创 2026-02-11 21:21:20 · 668 阅读 · 0 评论 -
RAG可以不用向量库?来围观一下这是怎么回事呢
传统向量RAG在专业长文档中常因“相似≠相关”而失效。一种新方法——PageIndex,放弃向量检索,转而构建文档结构索引,让模型像人一样“翻书”推理。实测在金融等强逻辑场景下准确率高达98.7%,为RAG提供了一条更可靠的新路径。原创 2026-02-09 15:23:12 · 656 阅读 · 0 评论 -
AI Agent如何实现记忆的三个维度详尽分析
智能体记忆远不止是“记住对话历史”。本文系统拆解其在形式上的三类实现(词元级、参数化、潜在记忆)、功能上的三大支柱(事实、经验、工作记忆)以及动态层面的形成-演化-检索闭环,揭示记忆如何使大模型从静态生成器转变为持续进化的智能体。原创 2026-02-09 15:12:36 · 845 阅读 · 0 评论 -
一起来围观Anthropic官方万的AI Agent评估方法论
为什么你的 Agent 总是“看起来行,实际上不行”?本文系统拆解 Anthropic 提出的 AI Agent 评估方法论,从 Transcript 与 Outcome 的根本区分,到三类评分器的组合策略,再到 pass@k 与 pass^k 的指标选择逻辑,揭示如何构建一个既能捕捉能力边界、又能保障稳定性的评估体系。这不是一套测试工具,而是一套理解智能体行为的语言。原创 2026-02-08 15:59:52 · 1047 阅读 · 0 评论 -
多模态 RAG 的新范式:Qwen3-VL-Embedding 与 Reranker 如何统一图文视频检索
Qwen3-VL-Embedding 与 Reranker 通过统一的多模态表征空间、三阶段训练策略和量化友好设计,解决了传统 CLIP 类模型在复杂文档与视频检索中的细粒度交互缺失问题,为视觉密集型 RAG 系统提供了端到端可行方案。原创 2026-02-06 23:46:08 · 866 阅读 · 0 评论 -
AI接管编码:软件工程师的“主编化”转型已不可逆
AI正以惊人速度接管代码编写,工程师角色正从“写作者”转向“审校者”。本文系统剖析这一趋势的技术动因、现实进展与职业影响,并指出:掌握AI协作能力,已成为新一代工程师的生存基本功。原创 2026-02-05 23:20:07 · 827 阅读 · 0 评论 -
Qwen3-Coder-Next开源了:来看它如何用3B激活参数撬动80B潜力的
仅激活30亿参数却能匹敌更大模型,Qwen3-Coder-Next通过大规模可执行任务训练与MoE架构,在真实软件工程环境中验证了“小激活、大能力”的可行性,为高效编程智能体提供了新路径。原创 2026-02-05 14:03:41 · 847 阅读 · 0 评论 -
蚂蚁最新8B小模型拿下SOTA
抛弃ID Embedding和LoRA参数,用自然语言描述用户偏好——蚂蚁与东北大学提出的AlignXplore+框架,以8B小模型实现跨任务、跨模型的SOTA个性化能力,让大模型真正“读懂”每一个具体的人。原创 2026-02-04 21:40:07 · 929 阅读 · 0 评论 -
自注意力机制如何让大模型真正“看见”上下文?
自注意力机制是Transformer架构的核心组件,它使模型能够动态衡量序列中任意两个元素的相关性,突破了传统RNN类模型在长距离依赖和并行计算上的瓶颈。本文系统解析其工作原理、多头扩展、计算特性及在多模态场景中的泛化能力,并探讨其作为大模型“感知引擎”的底层逻辑与未来演进方向。原创 2026-02-04 15:47:30 · 753 阅读 · 0 评论 -
RAG不是“能答就行”:一套可落地的评估体系,才是系统真正可用的关键
别再靠“感觉”调RAG了!本文系统拆解检索增强生成系统的评估方法论,从指标设计、工具选型到闭环落地,提供可直接复用的12项核心指标与5步实施流程,帮你把RAG从“能用”推向“好用”,让每一次优化都有数据支撑。原创 2026-02-04 15:35:14 · 762 阅读 · 0 评论 -
多模态RAG不是“加个图”那么简单:从解析到生成的全流程拆解
多模态RAG不是简单拼图,而是让文字、图片、音频在同一个语义空间里“对上暗号”。本文系统拆解其实现流程,从文档解析、嵌入融合到上下文构建,告诉你为什么“看起来很美”的多模态RAG,工程落地时却总让人直呼“这锅我不背”。原创 2026-02-01 17:23:14 · 631 阅读 · 0 评论 -
考虑多智能体在B端落地前企业自身需考虑管理文化的“AI化”
复杂B端业务中,单体“全能”智能体看似强大,实则脆弱。真正能稳定交付结果的,是分工明确、协同有序的多智能体架构——它把意图理解、任务规划与工具调用彻底解耦,让每个“数字员工”只做最擅长的事。原创 2026-02-01 17:17:58 · 651 阅读 · 0 评论 -
丢掉向量数据库!推理型 RAG 正在重新定义长文档问答的准确边界
传统 RAG 在处理专业长文档时频频失效,因其依赖语义相似度而非逻辑相关性。PageIndex 提出“无向量推理型 RAG”架构,通过构建语义树索引与路径推理,实现 98.7% 的金融问答准确率,彻底告别切片、向量库与黑盒检索。原创 2026-01-30 17:35:34 · 672 阅读 · 0 评论 -
GroupRank:分组重排,让大模型在 RAG 中又快又好地“挑重点”
RAG 系统中的重排序器长期面临效率与效果的两难。GroupRank 提出“组式”(Groupwise)新范式,在组内做比较、跨组可并行,既保留逐点灵活性,又具备列表式全局感知能力,并通过合成数据与强化学习训练,实现速度与精度的双重突破。原创 2026-01-28 16:57:02 · 577 阅读 · 0 评论 -
RAG中的四类索引,你都搞清楚了吗?
索引 ≠ 检索。RAG系统中,索引是为“更好被找到”而设计的结构,而非原始文档的简单存储。本文系统剖析四种智能索引方法——分块、子块、查询与摘要索引,揭示其适用场景与核心原理,并指出:只有让索引变聪明,生成才能真正靠谱。原创 2026-01-28 16:53:02 · 955 阅读 · 0 评论 -
RAG不是魔法,是工程:从知识库到企业部署的硬核实践
RAG不是万能解药,但它是当前大模型落地最可行的路径。本文系统拆解RAG全链路——从文档解析、向量构建、检索优化到生成控制与企业部署,揭示其成功依赖的不是模型本身,而是扎实的工程细节与对业务场景的深刻理解。原创 2026-01-27 22:00:54 · 781 阅读 · 0 评论 -
RAG落地不是拼乐高:三层架构才是知识库的真正骨架
RAG系统落地成败,关键不在大模型,而在知识库的三层架构是否扎实。本文从存储、处理到检索,系统拆解RAG知识库的核心组件与工程逻辑,揭示为何多数项目卡在“能用”却难“好用”。原创 2026-01-27 21:55:06 · 751 阅读 · 0 评论 -
Agent Skills:让你的AI编程助手真正“记住”你的喜好
本文深入解析Agent Skills技术原理,揭示如何通过结构化文档让AI编程助手记住用户偏好,实现精准的代码生成。从基础提示词优化到动态加载机制,逐步展示如何构建个性化AI开发工作流。原创 2026-01-26 23:02:13 · 1099 阅读 · 0 评论 -
Agent时代产品经理的进化:从需求翻译到问题塑造者
AI Agent正在重塑产品经理的角色。传统需求文档撰写者面临淘汰,而擅长问题定义和解决方案评估的PM将获得更大价值。本文探讨Agent时代产品经理需要掌握的新技能和工作模式转变。原创 2026-01-24 22:57:07 · 953 阅读 · 0 评论 -
向量数据库:从数学原理到技术落地的深度剖析
本文将系统解析向量数据库的核心技术原理,涵盖向量表示、嵌入技术、索引算法、相似度计算等关键环节。通过深入浅出的技术解读,帮助开发者全面理解这一推动AI应用落地的关键基础设施。原创 2026-01-23 14:45:54 · 654 阅读 · 0 评论 -
无师自通:Meta如何让AI在零数据环境下自我进化出顶级搜索能力
Meta的Dr. Zero框架突破性地实现了AI在零人类标注数据情况下的自我进化。通过提问者与解答者的自我博弈机制,配合创新的跳数分组优化算法,大语言模型仅凭搜索引擎就能训练出超越监督学习水平的搜索智能体。这种方法为解决数据稀缺问题开辟了新路径。原创 2026-01-23 14:40:31 · 905 阅读 · 0 评论 -
RAG不是万能的:没有可观测性,你的系统只是在“碰运气”
RAG系统上线后表现如何?别再靠“感觉”判断了。本文系统拆解RAG可观测性评估的核心指标,从检索到生成,从自洽性到显式验证,告诉你如何用可量化、可追踪、可归因的方法,把RAG从Demo变成真正可信的生产级AI产品。原创 2026-01-20 15:00:45 · 825 阅读 · 0 评论 -
RAG不是万能药:一份来自实战的避坑指南
本文系统梳理RAG落地过程中的26个高频问题,从选型决策、分块策略、检索优化到评估维护,结合工程实践与原理分析,揭示“看似简单”的RAG背后隐藏的技术细节与调优空间。适合正在构建或优化RAG系统的开发者收藏参考。原创 2026-01-19 16:00:21 · 989 阅读 · 0 评论 -
LangGraph:让AI学会“回头是岸”的智能体架构
LangGraph不是LangChain的插件,而是一场从“流水线”到“活大脑”的范式革命。它用状态机+循环图,赋予LLM应用记忆、反思与自我修正能力——这才是真正的Agentic AI。原创 2026-01-18 20:10:35 · 595 阅读 · 0 评论 -
就在刚刚谷歌悄悄加上了Antigravity ,从而彻底打响了AI编程的生态战争
谷歌悄然上线 Antigravity 的 Agent Skills 功能,兼容 Claude Code 技能标准、引入动态技能调用与全栈自动化能力,并搭配 Gemini 3 Flash 提速。这不仅是产品更新,更是对 AI 编码助手生态主导权的争夺。原创 2026-01-17 20:09:50 · 920 阅读 · 0 评论 -
2026数据分析Agent最新落地方向解析
数据分析Agent正从“对话取数”迈向“自主决策”,其技术路线已形成NL2SQL、NL2DSL到NL2Data的演进路径。本文系统拆解其内核架构、工程落地难点与未来方向,指出真正的价值不在于取代分析师,而在于将数据消费门槛降至人人可及。前言原创 2026-01-15 08:30:57 · 864 阅读 · 0 评论 -
为什么説Agent不是AI,而是新型软件架构?
大模型只是“思考者”,Agent才是“行动者”。本文系统梳理Google官方Agent白皮书核心框架,从四要素构成、五级能力演进到企业级安全治理,揭示Agent本质是围绕上下文动态管理的新型软件架构范式,而非简单的AI聊天机器人。原创 2026-01-15 08:20:49 · 1274 阅读 · 0 评论 -
小模型“开卷”逆袭:RAG性能瓶颈不在LLM,而在语料库规模
卡内基梅隆大学最新研究颠覆传统认知——在RAG系统中,扩大检索语料库比升级大模型更有效。小模型配合海量文档,性能可反超大模型。关键不在模型“脑子多大”,而在“资料多全”。原创 2026-01-13 12:06:24 · 930 阅读 · 0 评论 -
ChatBI不是“智能副驾”,只是披着对话外衣的遥控器
ChatBI曾被吹捧为“用一句话取代报表”的革命性工具,但现实却暴露出其在输出可信度、价值锚点和实施成本上的三重幻灭。本文系统剖析其与商业决策本质的深层冲突,并指出真正可行的方向是“AI增强分析”——不是用聊天取代思考,而是用智能放大人类判断。原创 2026-01-12 19:51:52 · 947 阅读 · 0 评论 -
MCP成最大的赢家
MCP在一年内从一个脆弱草案演变为AI生态通用接口,其成功源于社区驱动、巨头共识、安全重构与企业治理四大支柱,正成为AI连接现实世界的“USB-C”。原创 2026-01-12 14:40:00 · 1071 阅读 · 0 评论 -
Claude Skills到底是什么?
Claude最近推出的Skills、MCP、Projects、Prompts四件套,看似概念繁杂,实则分别解决AI助手“不能动手”“缺记忆”“效率低”“接入乱”四大痛点。本文用技术人听得懂的语言,厘清它们的功能定位、层级关系与使用优先级,助你快速上手这套AI生产力新范式。原创 2026-01-11 01:37:37 · 735 阅读 · 0 评论 -
AI工程化:从“炼丹”到“建药厂”的60分钟通关指南
AI模型再聪明,不工程化就是玩具。本文系统拆解AI工程化的核心目标、关键技术与典型陷阱,带你理解如何将一个Notebook里的模型,变成高可靠、低延迟、低成本的线上服务。原创 2026-01-08 17:27:13 · 152 阅读 · 0 评论
分享