- 博客(2289)
- 收藏
- 关注
原创 AI产品经理转行分析(最下方附真实案例)
近两年来,人工智能产业浪潮席卷全球,《中国互联网发展报告(2025)》指出,截至2025年10月,我国人工智能核心产业规模达5784亿元,同比增长158%;从企业数量来看,截至2025年10月,我国AI企业数量超过4500家,产业竞争力持续增强。
2026-03-14 20:28:26
246
原创 图模型合并基础教程(非常详细),ICLR 2026 G-Merging框架从入门到精通,收藏这一篇就够了!
不同行业的图数据具有天然的差异化特性,使得图模型的学习面临着更严峻的多域多任务泛化挑战。
2026-03-13 18:44:42
304
原创 多模态表征入门基础教程(非常详细),顶刊TPAMI新论文深度解析,收藏这一篇就够了!
本文提出了一种表示重构机制 ,通过可学习的动态权重将单模态表示的精细粒度与跨模态表示的自适应特性进行有机融合。具体而言,视频表示被重构为单模态特征与文本查询条件下的跨模态特征的加权组合,权重γ由二者差异经MLP自适应预测得出,使得模型既能保留原始帧级细节,又能动态抑制无关信息;类似地,文本表示通过视频帧的均值查询重构,权重δ同步学习,确保在实体级对齐时单模态信息占优,而在更高语义层级上跨模态信息能发挥调节作用。这种重构策略从根本上解决了Banzhaf交互的计算偏差问题,使得后续博弈建模建立在更可靠的特征基础
2026-03-13 18:40:20
304
原创 多模态大模型的技术难点是什么,业界有什么解决方案?
多模态大模型(Multimodal Large Language Model,MLLM)多模态大模型是一种能够同时处理和理解多种数据类型的AI模型,其核心目标是实现对文本、图像、视频等多种模态信息的统一理解与生成。
2026-03-13 18:36:34
366
原创 无向量RAG检索召回——PageIndex
今天我们来聊聊无向量检索主角——PageIndex。可能大家也知道,向量检索是很早的一个技术,它是基于语义理解和相似度进行匹配检索,目前也在很多地方使用到,然而技术的发现,它的很多问题都暴漏出来了,如:
2026-03-12 21:35:25
11
原创 HippoRAG核心逻辑和代码解读
HippoRAG,它的核心灵感来自人脑的记忆机制,**把 LLM 类比为新皮层**、**知识图谱 + PPR 算法类比为海马体**,主打让传统 RAG 实现高效的多跳推理,解决了传统图谱检索中实体关联不紧密、推理链路不清晰的问题。
2026-03-12 21:34:30
69
原创 开源|企业 AI 知识库怎么搭建?2026 年 AI 知识库搭建指南
如何快速搭建适配自身业务的企业级 AI 知识库,成为众多企业的难题。ChatWiki 作为一款开源的知识库 AI 问答系统,已获 1.7K GitHub Star ,以轻量化部署、多模型适配、全场景覆盖的优势,成为 2026 年企业搭建 AI 知识库的优选工具,轻松实现从知识沉淀到智能应用的全流程落地。
2026-03-12 21:32:22
76
原创 解决对话过长难题全攻略(非常详细),上下文窗口管理从入门到精通,收藏这一篇就够了!
20 轮对话就奔着 25000 tokens 去了。如果中间调了几次工具读文件、搜网页,轻松翻倍到 50000+。DeepSeek 的窗口是 128K,Claude 是 200K,听起来很大?Agent 消耗 token 的速度比你想象的快得多——一次代码分析任务调 15 轮工具,上下文就能吃掉一半窗口。
2026-03-12 21:30:34
117
原创 保姆级教程!Transformer架构原理全解(非常详细),从入门到精通,收藏这一篇就够了!
由于Transformer模型的出现和快速发展,深度学习领域正在经历一场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多方面。
2026-03-12 20:29:57
277
原创 学习Transformer只需弄懂这7个问题(非常详细),从入门到精通,收藏这一篇就够了!
当初掌柜利用工作之余足足半年多时间才把整个 transformer 的原理动机、实现过程以及两个实战代码给梳理清楚,光是插图就绘制了50多幅,最后更是写下了超过4万多字的内容,其中很多细节之处都是你先前没有想到过的,以致于太多的人对此的评价都是“常读常新”。
2026-03-12 20:28:30
241
原创 Transformer学习笔记精华整理(非常详细),算法原理从入门到精通,收藏这一篇就够了!
Transformer模型是一种基于注意力机制的深度学习模型,最初由Vaswani等人在2017年的论文《Attention is All You Need》中提出。Transformer彻底改变了自然语言处理(NLP)领域,并逐渐扩展到计算机视觉(CV)等领域。Transformer的核心思想是完全摒弃传统的循环神经网络(RNN)结构,仅依赖注意力机制来处理序列数据,从而实现更高的并行性和更快的训练速度。
2026-03-12 20:26:56
315
原创 Transformer原理解析(非常详细),LLM底层秘密从入门到精通,收藏这一篇就够了!
最近AI的发展实在是太快了,近期B站上AI二创视频、AI让西游记角色唱歌的视频很火,笔者也尝试做了简单复现,用银角大王唱个歌《奉命张狂》,由衷感叹AI太强了。
2026-03-12 20:25:04
322
原创 大模型如何重塑银行业务?Transformer架构深度解析(非常详细),从入门到精通,收藏这一篇就够了!
2017年,Google一篇《Attention Is All You Need》论文,让Transformer架构横空出世,此后不仅撑起GPT、BERT等主流大模型的核心骨架,更从自然语言处理领域延伸至金融、医疗等行业,成为驱动AI技术落地的关键引擎。对银行业而言,Transformer看似是抽象的技术概念,实则其核心设计正精准匹配银行对**效率提升、风险管控、服务升级**的需求,而大模型的强大,本质就是Transformer架构优势的规模化放大。
2026-03-12 20:22:00
341
原创 终于讲透了!Transformer模型核心原理(非常详细),AI大模型从入门到精通,收藏这一篇就够了!
人工智能作为当今最前沿的科技之一,正在以令人惊叹的速度改变着我们的生活。从智能语音助手到无人驾驶汽车,从 AI 绘画到机器学习,它为我们打开了一个充满无限可能的未来。本栏目将以通俗易懂的方式,用视频和文字给孩子讲述人工智能的原理、应用及其对社会的深远影响。
2026-03-12 20:20:07
228
原创 银行Agent化运营架构方案(非常详细),企业级Agent OS从入门到精通,收藏这一篇就够了!
在金融科技进入智能化下半场的背景下,银行智能化建设已从“零散技术应用”向“体系化Agent化运营”转型。当前,部分银行虽已布局大模型、知识库、Skill库等核心组件,但仍未实现真正的Agent化运营——缺乏一个统一的“智能中枢”,导致各组件协同不畅、资源浪费、业务适配性不足。本文深度研究银行Agent化运营的核心逻辑,提出企业级Agent操作系统(Agent OS)架构方案,明确其作为银行未来“智能核心系统”的核心地位,拆解架构分层、核心模块、治理体系及建设路线,为银行实现Agent化转型提供可落地、可演进
2026-03-11 20:10:12
361
原创 企业新一代BI落地指南(非常详细),知识图谱+业务知识引擎从入门到精通,收藏这一篇就够了!
新一代的企业数据智能不是**聊天机器人**,不是**报表工具**,不是**大模型套壳**。而需要它**懂数据、懂业务、懂逻辑、可解释、可落地、可治理
2026-03-11 20:08:32
281
原创 全模态AI智能体入门指南(非常详细),人大&小红书OmniGAIA新基准深度解析,收藏这一篇就够了!
人类的智能行为天然融合了视觉、听觉、语言等多种感知方式,并能够进行深度思考,以及在遇到难题时熟练调用外部工具来辅助任务完成。然而,当前主流的多模态大模型(MLLM)仍主要局限于图文或音文等双模态交互,缺乏作为通用 AI 助手所需的全模态认知、长程推理与工具调用能力。
2026-03-11 20:07:05
324
原创 AI智能体长时记忆架构构建指南(非常详细),本体与图谱存储从入门到精通,收藏这一篇就够了!
在AI智能体发展中,记忆已成为关键瓶颈。本文探讨为何本体提供结构化理解,而图存储则实现高效的知识积累、查询与演化。通过本体与图的结合,代理可实现可靠的多步推理与长期协作,适用于企业级应用。
2026-03-10 16:05:22
358
原创 清华新研究证实LLM已攻克时序知识图谱RAG检索任务
一句话概括,这篇论文彻底撕下了复杂检索流水线的遮羞布,证明在处理跨度多年的动态知识图谱时,赋予大模型自主规划和碰壁回滚的“找茬”能力,比任何人类硬编码的推理路径都要管用得多。
2026-03-10 16:03:29
370
原创 SkillRL:让智能体学会“技能进化”的强化学习框架
本工作提出 SKILLRL,一种通过“经验蒸馏 → 技能库构建 → 递归技能进化”的强化学习框架,使 LLM Agent 能从交互经验中自动抽象技能并持续进化,从而显著提升复杂任务表现与学习效率。
2026-03-10 16:01:50
377
原创 构建自己的AI编程助手(非常详细):基于RAG的上下文感知实现方案,从入门到精通,收藏这一篇就够了!
很多人觉得做个AI助手就是调调OpenAI的接口,其实这样智能做出一个通用聊天机器人。
2026-03-09 20:44:58
304
原创 从零开始构建自进化智能体的心路历程
我们提出了 **Yunjue Agent**,一个面向开放域任务的原地自进化智能体系统。与当前主流的”在新环境生成数据再训练”范式不同,我们认为真正的自进化应该是 **In-Situ(原位自进化)**——在推理过程中持续积累工具能力,无需外部监督。
2026-03-09 20:43:39
328
原创 LLM与GBDT表格建模实战(非常详细):Titanic验证Scaling Law,从入门到精通,收藏这一篇就够了!
本文介绍 Titanic - Machine Learning from Disaster 比赛中对比当前表格数据建模领域中最顶尖的几种技术,由 Kaggle 专家 **Giba** 分享。
2026-03-09 20:39:58
359
原创 多智能体系统架构设计(非常详细):软件工程分层与解耦实战,从入门到精通,收藏这一篇就够了!
ChatGPT 发布之后,AI 智能体的概念就一直牵动着整个行业的想象力。它描绘的场景很诱人:给 AI 系统一个目标,让它自行拆解问题、调用工具、收集信息,最终综合出结果。
2026-03-09 20:38:40
422
原创 OmniVideo-R1:当“多模态”拖累了“推理能力”,如何破局?
在通往通用人工智能(AGI)的道路上,我们通常持有一个朴素的假设:**输入的信息模态越多,模型的理解能力应该越强。** 人类能够同时处理视觉和听觉信息,从而构建对世界的完整认知,模型也理应如此 。
2026-03-09 20:37:17
335
原创 10万文档 RAG 落地实战教程(非常详细),从 Demo 到生产全流程,收藏这一篇就够了!
在过去一年里,RAG(Retrieval-Augmented Generation)几乎成了企业落地大模型的标准配置。
2026-03-08 10:45:00
352
原创 Agent 记忆系统实战教程(非常详细),从原理到落地,收藏这一篇就够了!
他打开监控面板,查看日志,翻阅 Wiki,逐步排查——连接池耗尽、上游服务限流、数据库慢查询......两小时后终于定位:**Redis 集群发生了主从切换,客户端连接池未及时刷新**。
2026-03-07 20:08:35
373
原创 vLLM框架入门基础教程(保姆级详解),vLLM从入门到精通,收藏这一篇就够了!
作为vLLM源码的开发者、框架的使用者,刚接触vLLM框架时会有这样的问题“如何快速地了解vLLM全貌?”。推荐的一个学习步骤:先大致了解整体运行流程,接着理解关键模块逻辑,然后学习关键特性。同时,逐步理解源码。
2026-03-07 20:06:18
436
原创 7年Java经验转型AI应用开发实录(非常详细),30岁职场逆袭从入门到精通,收藏这一篇就够了!
去年6月份,我做了一个连自己都觉得疯狂的决定:裸辞,All in AI。
2026-03-05 21:31:40
353
原创 99K+ Star 开源项目实战指南(非常详细),AI应用开发从入门到精通,收藏这一篇就够了!
想快速上手 AI 应用开发?这个仓库收录了近 80+ 个精选项目,涵盖 RAG、AI Agents、多智能体协作等核心技术,从入门到实战,一网打尽。
2026-03-05 21:28:30
356
原创 AI大模型术语速查手册(非常详细),100个概念从入门到精通,收藏这一篇就够了!
多数人把AI用不好,不是因为不会写提示词,而是因为把底层概念混在一起用了。老王给一个反常识判断,决定你能不能把AI用成稳定生产力的关键,不是问出一句漂亮提问,而是能不能分清生成能力、记忆边界、事实可靠性、工程约束这四层逻辑。
2026-03-05 21:27:13
356
原创 AIGC开源推荐-企业内部agent框架-Goose
Goose 是由 Block 发布的开源、可扩展的「工程/企业向 AI agent 平台」,侧重把企业既有工具(通过 MCP 扩展)与本地执行能力结合,解决工具碎片化、隐私合规、多 agent 编排与工程效率提升等问题。该报告整合了源码架构要点、关键模块解读、能切中行业痛点的能力、产品定位、竞品对比与可执行落地建议。
2026-03-04 19:02:59
374
原创 OpenRAG实战:打造高效Agentic RAG系统的秘诀
随着生成式 AI 模型的快速演进,超长上下文窗口技术让“将整个图书馆塞进 Prompt”变成了现实。行业内随之出现了一种声音:当模型能够处理百万级甚至更多 Token 时,检索增强生成(RAG)是否已失去存在的意义?
2026-03-04 19:01:31
401
原创 多模态必读!InstructBLIP深度全解(干货满满),从入门到精通,收藏这一篇就够了!
在多模态人工智能领域,如何让模型理解并执行各种视觉-语言任务一直是一个挑战。2023年5月,Salesforce Research提出了**InstructBLIP**,一个通过指令微调(instruction tuning)构建通用视觉-语言模型的框架。**其核心目标是让一个统一的模型能够理解并执行各种类型的视觉-语言任务,而无需为每个任务单独设计输入输出格式。
2026-03-04 18:53:16
404
原创 多模态特征融合,顶会发文的首选!
多模态学习中,视觉与文本的高效融合是提升模型性能的关键。当前方法常面临两大瓶颈:一是特征利用不充分,多仅采用视觉编码器的单层输出,缺乏对深浅层互补特征的整合;二是对齐依赖强,需要大规模精准配对数据,对未对齐或噪声数据鲁棒性不足。
2026-03-03 20:12:18
151
原创 智能运维AIOps实战教程(非常详细),技术架构与落地实践从入门到精通,收藏这一篇就够了!
在数字化浪潮下,IT系统向分布式、云原生、大规模加速演进,传统运维面对指数级增长的数据量、错综复杂的系统依赖,已难以为继。
2026-03-03 20:10:48
494
原创 TMM 2025 | 多模态意图理解新标杆!MIntOOD 动态平衡模态权重,IDOOD 任务双突破
多模态意图理解旨在融合文本、视频、音频等模态信息,解析人类对话中的复杂意图。但这一领域长期面临两大挑战:
2026-03-03 20:09:03
141
原创 多模态协同增强技术教程(非常详细),DHMD框架原理解析从入门到精通,收藏这一篇就够了!
多模态情感识别(Multimodal Emotion Recognition, MER)旨在对语言、语音、视觉等多源信息进行统一建模与协同理解,从复杂数据中捕捉人类情感的细微变化。近年来,MER 领域方法不断涌现,整体性能持续提升,但一个核心难题始终存在——模态之间的异质性与语义鸿沟,使得稳定、鲁棒的多模态表示学习依然充满挑战。
2026-03-03 20:07:52
336
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅