- 博客(1121)
- 收藏
- 关注
原创 安全运营 Agent 落地:让 LLM 亲手把自己「炼」成规则
本文基于笔者在安全告警研判系统中的实践经验,聊聊把 LLM 和 Agent 引入安全运营后踩过的坑、想明白的事。不是教程,单纯个人思考、发现,希望对你有启迪。
2026-03-14 14:58:52
905
原创 一文读懂 MCP、RAG、Agent
最近,AI 圈被三个词刷屏了 ——MCP、RAG、Agent!几乎每天都有新的相关工具冒出来,各大技术论坛、行业群聊得热火朝天。但不少朋友一看到这些术语就犯迷糊:它们到底是啥?能干啥?和我们普通人又有啥关系?别慌!今天就用最接地气的方式,带你彻底搞懂这些概念,看完秒变 AI 达人!
2026-03-14 14:51:52
347
原创 我用了两周_OpenClaw,终于明白为什么它能火成这样
写这篇文章的时候,我一直在想一个问题:OpenClaw 到底意味着什么?我觉得它最重要的不是 GitHub 上的 Star 数量,而是它用一个实际可跑的项目,把很多人心里对"可用 AI"的想象具体化了:AI 不再只是在屏幕里聊天,而是像一个常驻的数字员工,和你的操作系统、应用、账号一起构成新的工作流。它的爆火或许会被后来的项目超越,但"聊天入口 + 多模型决策 + 系统级执行 + 长期记忆与定时任务"的组合,很可能会成为未来几年 AI 应用的基本范式之一。
2026-03-11 13:58:11
591
原创 OpenClaw AI手册指南.pdf(2026)
最近一段时间,OpenClaw 在全球开发者社区和技术圈迅速升温,很多朋友在后台问我们:它为什么这么火?它到底代表了什么样的变化?正是带着这些问题,边缘计算社区决定系统性地做一次研究和梳理,最终有了你现在看到的这份《OpenClaw AI手册指南》。
2026-03-11 13:42:55
734
原创 AI智能体vs工作流(收藏必备)从零基础入门到精通,看这一篇就够了!
一句话定义:Agent是一个“有想法,且能落地”的助理,只需要告诉它“最终要达成什么目标”,它会自己想办法,做决策,解决问题甚至调整步骤。一句话定义:工作流像一条“提前设定好的流水线”,你要先明确“每一步做什么?谁来做?做完交给谁?”它只负责按顺序推荐,不做任何决策,也不会调整步骤。
2026-02-14 09:30:00
1218
原创 不懂RAG?看这一篇万字长文就够了!
文章全面介绍检索增强生成(RAG)技术,包括其解决传统语言模型局限性的必要性、核心组件(检索与生成)、关键技术步骤(用户意图理解、知识解析、嵌入、索引、检索、整合、生成和引用),以及高级RAG方法。RAG结合检索系统和生成模型,实现动态访问外部知识,显著提升模型在问答、摘要等任务中的表现。本文转发自:大语言模型论文跟踪,主要是对论文《A Survey on Knowledge-Oriented Retrieval-Augmented Generation》的解读。
2026-02-12 10:45:00
387
原创 AI大模型Skills完全指南:从入门到精通,一篇就够了!
文章介绍Google的Antigravity AI IDE支持的Agent Skills功能,Skills是通过编写SKILL.md文档指导AI完成特定任务的标准化方法。文章展示了Skills的两种类型(项目级和全局级),并通过测试表明不同平台对Skills的支持已趋于一致。Skills的价值在于实现一次编写全平台通用、降低创作门槛、启动生态效应,可能开启AI应用开发的新时代。昨天,Google 的 Antigravity 正式宣布支持 Agent Skills 了。
2026-02-09 11:55:54
1961
原创 AI大模型实战教程(超详细+代码)从零基础到精通,一篇全搞定,值得收藏!
本文详细探讨了基于大语言模型的智能体系统架构与实现方法。从LLM的核心能力出发,解析了智能体的三层结构(感知、决策、执行)及上下文管理机制,并介绍了如何集成API与向量数据库增强智能体功能。文章还介绍了ReAct、Hugging Face和LangChain等主流框架在智能体开发中的应用,为构建高效、灵活的智能体系统提供了全面的技术指导与实践案例。大语言模型(LLM)作为智能体的核心引擎之一,为智能体的构建带来了新的范式。
2026-02-09 11:42:33
746
原创 Agent思维链核心技术详解(保姆级教程)
目前 claude 4 sonnet、gemini 3 在 Agent 工具调用的场景下,都强制要求带工具调用的思考内容和签名,这个链路正常是能很大程度提升整体的推理执行效果,是 Agent 多步骤推理的必需品。但目前 Agent 模型的稳定性还是个问题,例如在某些场景下,业务逻辑明确需要下一步应该调工具 A,但模型思考后可能就是会概率性的调工具B,在以前是可以直接 hack 替换调工具调用,或手动插入其他工具调用,没有副作用。
2026-02-09 11:33:22
578
原创 2026个人 AI 知识库最优解
💡 核心要点 / Key Insights2026个人 AI 知识库最优解 作为一名深耕 OneNote 多年的老用户,我曾习惯于将所有的思考、摘录和文档通通塞进那个层级分明的笔记本里。但进入 AI 时代后,我意识到那种“…
2026-01-14 11:18:20
1291
原创 # 2025 年大模型盘点:DeepSeek 时刻、Llama 失宠、刷榜泛滥...
本文基于老司机推荐的年终盘点这篇文章的原始作者叫 Raschka,长期在 Substack 输出技术内容。他的书被翻译成9种语言,被多所大学用作教材以下这些,是他对 2025 年大模型领域的观察和判断,在这里我做了一些重写&删改。
2026-01-14 10:52:16
641
原创 这是一份大模型应用学习路线!(附学习资料)
本文系统介绍大模型应用学习的五大核心技术:提示词工程、检索增强生成(RAG)、微调、模型部署及人工智能系统。通过从基础沟通技巧到高级系统构建的完整学习路线,帮助读者掌握大模型应用全流程,为成为年薪50W+的大模型应用工程师奠定基础,适合零基础入门到进阶学习。最近两年大模型发展很迅速,在理论研究方面得到很大的拓展,基础模型的能力也取得重大突破,大模型现在正在积极探索落地的方向,如果与各行各业结合起来是未来落地的一个重大研究方向。
2026-01-09 16:07:19
756
原创 AI大模型教程(史上最详细+建议收藏)从零基础入门到精通,一篇就够了!
中国大模型行业蓬勃发展,产业链涵盖基础层、模型层和应用层。当前商业化进程活跃,金融、政府、教育等领域渗透率高。2023年市场规模增长超100%,预计2030年将超2200亿元,年复合增速40%以上。未来预测大模型、决策大模型和具身智能大模型有望成为行业新风口。百度、阿里、腾讯等企业积极布局,专利申请数量领先。行业概况1、定义大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。
2026-01-09 16:04:39
989
原创 国产AI大模型TOP50排行榜!最强的是这两个!
文章介绍了国产AI大模型的发展现状,分析了百度文心一言、腾讯元宝、阿里通义千问等主流产品。根据访问量排名,网站端DeepSeek领先,APP应用端豆包和字节跳动表现最佳。文章指出,头部互联网企业在AI大模型领域具有竞争优势,并建议大多数用户选择DeepSeek或豆包AI即可满足需求。还记得2022年11月30日Chat-GPT3.5发布吗?短短5天的时间,其用户量就飞速突破了100万。时至今日,从第三方数据显示,2025年12月统计的月活跃人数达到了惊人的9.1亿。
2026-01-09 14:17:29
1525
原创 太强了!AI领域权威专家Antonio Gulli精心打造的《智能体设计模式》终于发布了!附PDF
📖这本书阅读价值拉满书里一口气系统梳理了21种关键设计模式,像提示链、动态路由、并行执行、反思优化、工具调用、任务规划、多智能体协同、记忆管理这些核心议题,全都被安排得明明白白🤩 每种模式都配有能直接执行的代码示例,还有超详细的图解说明,就算你是小白,也能快速把设计理论变成实际应用!而且把当前主流的智能体设计模式全整合在一起,理论框架和实践方法两手抓,知识体系超稳固。每章都有能直接运行的代码,你可以尽情动手实验,还能根据自己的需求调整优化。
2026-01-09 11:47:44
597
原创 LLM基础 ——让 Transformer 模型可视化
全文完。到这里,我们介绍了 Transformer 的基础知识,从模型架构、神经网络层、Attention、到 KV Cache ,也介绍了更深入的 MLA 和 MoE。DeepSeek 论文详细介绍了大模型从模型到基础设施的方方面面,非常值得阅读。而 Polo Club 的可视化 Transformer 可以动态交互,非常方便学习。
2026-01-06 14:16:02
1059
原创 从RAG到上下文工程:解决大模型“Lost in the Middle“问题,看这一篇就够了!建议收藏!
做一个好用的 Agent,底层依赖的往往不是什么惊天动地的“屠龙之术”,而是这些看似不起眼的、点点滴滴的细节。在这波大模型落地的早期,我们总是期待有一个“全知全能”的模型横空出世,通过无限大的上下文窗口解决所有问题。我们迷信参数的规模,迷信窗口的长度,仿佛只要模型够强,工程就不再重要。但大模型到目前为止,不是魔法,它只是一个新的计算组件。就像 CPU 需要缓存机制,数据库需要索引策略一样,大模型也需要精密的上下文工程来辅助其运转。伟大的产品,往往就诞生在对这些细节的极致掌控之中。
2026-01-06 14:12:37
1231
原创 LangChain系列|从V1.0启航构建智能体
LangChain和LangGraph在 2025 年10 月迎来V1.0 正式版(截至目前已更新至V1.1.0),这次升级极大提升了构建 AI Agent 的灵活性、扩展性与兼容性。LangChain:为构建基于大型语言模型的应用提供可复用组件与集成方案。LangGraph:智能体编排框架,以图结构构建大型语言模型智能体应用。LangChain 中的智能体功能正是构建于 LangGraph 之上,以实现。
2025-12-31 11:09:22
879
原创 AI产品思考:从Gemini3到Nano_Banana再到NotebookLM
从这份产品货架图可以看出,Google的AI产品战略是全面且深入的。它不仅拥有行业领先的基础模型。
2025-12-31 11:00:59
1065
原创 教你从零“手搓”一个大模型,别再只会调用API了
在大模型满天飞的今天,我们是甘心做一个只会调用 OpenAI.chat.completions 的 API 搬运工,还是想真正弄懂那个黑盒子里到底发生了什么?本文将用最朴素的代码,完整的实现一个小型LLM。当你亲手写出 Attention 层的矩阵乘法,亲眼看到模型从输出乱码到学会说话,你会发现:大模型,其实也没那么可怕。RoadMap。
2025-12-27 12:04:05
1141
原创 构建医疗AI智能体框架:从感知到推理的六大核心模块
本文提出了医疗AI智能体的六大核心模块框架:感知、对话接口、交互系统、工具集成、记忆学习和推理。通过七种专业智能体类型的协同配合,构建安全、可解释且自适应的医疗AI系统,推动人工智能在医疗领域的深度应用。原文PDF https://t.zsxq.com/wKnwa开发医疗AI智能体远比将通用算法简单应用于临床数据复杂得多。它需要深思熟虑地构建模块化、专用架构,能够在复杂的医疗生态系统中模拟智能、上下文感知的协作者。
2025-12-25 16:01:30
1025
原创 Dify企业版 vs 开源版:6大核心差异,一文讲透!
随着AI进一步的发展,越来越多的企业开始着手于内部的私有化AI建设,通过AI应用的构建、普及加强员工AI素养,提升员工工作效率,而Dify凭借其强大而友好的AI大模型应用编排能力,以及开源免费的特性,受到了众多企业的青睐,逐步成为各企业构建私有化AI平台的首选。Dify除了免费的开源版本,还面向各企业提供Dify企业版,因为两者主要的差异点不是在具体的应用功能上,而是在服务,部署方式以及性能方面,大部分文章描述的不是那么通俗易懂,今天,我就通过更简单形象的表达来讲清楚两者的核心差异点。
2025-12-25 11:51:51
913
原创 上下文工程之后又一门新兴技术:智能体工程!从零基础到生产环境部署,一篇全掌握!
智能体工程是将非确定性的大语言模型(LLM)系统逐步优化为可靠生产级应用的迭代过程。这是一个循环往复的流程:构建、测试、部署、观察、优化,再重复。核心要点在于,部署并非最终目标。它只是一种手段,帮助你获取新的洞见并改进智能体。要实现有意义的优化,你需要了解生产环境中的实际运行情况。这个循环迭代的速度越快,智能体的可靠性就会越高。
2025-12-24 10:30:54
1006
原创 知识图谱公司 Timbr的GraphRAG:用结构化+非结构化数据赋能更智能的AI
GraphRAG(基于图的检索增强生成)是一种新兴方法,它通过结合图驱动的结构化数据检索与基于向量的非结构化数据搜索,增强了传统RAG的能力。在标准RAG设置中,LLM通过从文档中检索文本片段(通过向量相似度)来回答问题。这种方法在许多情况下有效,但在处理需要连接事实或对结构化数据进行推理的复杂查询时却力不从心。基线RAG系统往往"难以将各个信息点连接起来",也难以理解大型文档中的整体概念。对比维度传统DIY GraphRAG知识图谱设置。
2025-12-24 10:25:58
840
原创 AI Agent实战全攻略:从零基础到精通,构建高性能数字员工的10大核心经验,一篇就够了!
核心原则:如果你的领域任务相对独特且对稳定性要求较高,自定义工具协议和指令是值得尝试的。由于我们的Agent项目起步较早,在2023年Qwen模型刚推出的时候,我们就开始探索早期的Agent调用了,在当时业界的工具调用标准尚未统一,我们就自定义了一套工具调用协议。这套协议除了包含工具的Schema,还在Prompt中加入了一些针对我们领域的特定要求和提示词指令。后来,业界标准逐渐向OpenAI的Function Call协议以及Anthropic 的MCP协议统一,我们也开始做相关的兼容测试。
2025-12-20 10:51:15
1133
原创 为什么说多模态是推荐系统破局的关键?来自闪购一线的实战复盘
从这些工作可以看出,业界在多模态推荐的两大核心挑战上形成了不同的技术路线:基于ID交互关系对齐(快手QARM):适配现有推荐行为分布,但可能导致多模态特征退化;基于语义交互关系对齐(阿里妈妈):保持语义纯粹性,但可能脱离真实推荐场景;联合训练对齐(小红书AlignRec):通过深度融合平衡两者,但训练复杂度较高;量化编码(快手):将语义特征转化为可更新的语义ID,解决多模态表征更新问题;相似度分桶(淘宝):将连续相似度离散化为固定维度向量,简化使用方式;
2025-12-20 10:35:53
696
原创 什么是智能体工程Agent_Engineering?从零基础入门到精通!
智能体工程其实就是一个不断迭代的过程,把那些"不太靠谱"的大模型系统,慢慢打磨成生产环境能用的稳定应用。构建、测试、上线、观察、优化、重复。智能体工程循环图划重点:上线不是终点,而是开始真正学习的时刻。想让智能体真正靠谱,你必须知道它在生产环境里到底干了啥。这个循环转得越快,智能体就越稳。
2025-12-19 11:46:35
1471
原创 知识图谱从0到精通:9大核心技术详解,小白程序员必备指南!
知识图谱是揭示实体间关系的语义网络,构建包括九大核心技术:知识抽取、实体抽取、关系抽取、属性抽取、实体对齐、知识表示、知识融合、知识更新和知识推理。这些技术从异构数据源提取实体和关系,通过RDF三元组等形式表示知识,融合不同来源信息,解决冲突,形成高质量知识库,并通过推理挖掘隐含知识。本质上,知识图谱是一种揭示实体之间关系的语义网络,是对现实世界事物及相互关系的形式化描述。1、知识抽取。
2025-12-18 16:12:14
619
原创 认识AI智能体:是什么?能做什么?
AI智能体是怎么工作的?Model 模型(大脑):这是核心,通常是一个语言模型,负责思考、分析和做决策。你可以为它选择最合适的“大脑”,甚至专门训练它,让它更擅长处理特定任务。Tools 工具(手脚):模型本身与世隔绝,工具就是它的手脚。通过这些工具,智能体才能与现实世界互动,比如查询数据、执行操作,从而完成模型本身做不到的事情。Orchestration 编排层(工作流程):这是驱动智能体的固定工作模式,基本遵循“观察-思考-行动”的循环。它会一直重复这个流程,直到任务完成。
2025-12-18 14:02:49
1430
原创 什么是智能体工程Agent Engineering?
智能体工程其实就是一个不断迭代的过程,把那些"不太靠谱"的大模型系统,慢慢打磨成生产环境能用的稳定应用。构建、测试、上线、观察、优化、重复。智能体工程循环图划重点:上线不是终点,而是开始真正学习的时刻。想让智能体真正靠谱,你必须知道它在生产环境里到底干了啥。这个循环转得越快,智能体就越稳。
2025-12-17 14:59:23
1046
原创 多模态RAG技术总结及知识图谱构建分割+抽取+验证三阶段思路
RAG作为一种范式,可以灵活扩展,可以来个暴力组合,写综述。变成从文本RAG到多模态输入-文本输出,再到多模态输入-多模态输出的一个演进。这块,看一个技术总结,如《》,https://doi.org/10.36227/techrxiv.176341513.38473003/v2,https://github.com/INTREBID/Awesome-MM-RAG,所有可能使用的模态组合作为输入和输出,包括文本、图像、音频、视频、代码、表格、知识图谱、3D 对象等。一共54个。看几个点。
2025-12-11 11:26:48
940
原创 Google上下文工程精解:从Sessions到Memory,打造智能Agent完全指南!
文章基于Google发布的上下文工程白皮书《Context Engineering: Sessions & Memory》,系统介绍了构建智能Agent的两大基础:会话(Sessions)与记忆(Memory)。通过精读、翻译与结构化整理,提供了理论框架和实践指南,帮助读者理解如何打造更聪明、更个性化、可持续学习的AI Agent,以PPT形式呈现便于掌握关键思想与应用方法。Google 在上月发布了一篇重要的上下文工程白皮书与。
2025-12-05 11:57:20
1096
原创 《Agentic设计模式》:构建智能系统的实战指南!
简单来说,AI智能体是一个能够感知环境并采取行动以实现特定目标的系统。它是大语言模型(LLM)的进化版本,增强了规划、使用工具和与环境交互的能力。接受任务:你给它一个目标,如"整理我的日程"扫描环境:收集所有必要信息——读取邮件、检查日历、访问联系人制定计划:思考实现目标的最佳方法执行行动:发送邀请、安排会议、更新日历学习改进:观察结果并适应调整,持续优化这种循环机制让AI智能体能够像人类助手一样在工作中不断学习和改进。
2025-12-05 11:47:36
868
原创 大模型推理引擎全解析:从Transformers到vLLM,一篇掌握技术选型与优化秘籍(收藏必备)
文章深入解析大模型推理引擎技术演进,对比Transformers动态图、llama.cpp量化优化与vLLM分页内存管理三大核心技术,通过操作系统类比帮助理解技术本质,并提供针对不同硬件环境与业务需求的精准选型指南,助力开发者高效落地。后台收到了不少朋友的留言。大家在尝试部署本地大型语言模型(LLM)时,面对llama.cppvLLMOllama等 LLM 领域技术名词,往往感到困惑:它们是对开发者透明的工具,还是有必要优化的技术?
2025-12-04 15:44:34
1016
原创 知识图谱增强大模型实战教程:零基础入门到精通,一篇就够了!
本文提出NRAG框架,创新性地融合大语言模型与医学知识图谱,专注于门急诊神经外科疾病诊断。该框架通过知识图谱检索补充缺失症状信息,实现可解释的智能诊断,F1分数达0.8150,为临床辅助决策提供可靠依据。原文pdf:https://t.zsxq.com/5kL64NRAG框架代表了人工智能辅助医疗诊断领域的重大突破,成功解决了传统诊断系统长期面临的核心挑战。通过创新性地融合大语言模型与医学知识图谱,NRAG在门急诊神经外科这一时间敏感、信息碎片化的复杂场景中,实现了准确性、可解释性与实用性的完美平衡。
2025-12-04 15:00:32
1346
原创 仅需3元+2小时,从零训练出25.8M超轻量语言模型?
MiniMind是轻量级大模型开源项目,仅25.8M参数却实现对话能力。项目提供从环境准备到模型训练的极简路径,使用PyTorch原生实现,降低学习门槛。当大语言模型还在比拼千亿参数、百亿算力时,一个反其道而行之的项目悄然走红——MiniMind用25.8M参数(仅为GPT-3的1/7000)、3元服务器成本和2小时训练时间,实现了从0到1构建可对话的语言模型。这个完全开源的项目,正在重新定义普通人接触大模型的门槛。
2025-12-04 11:47:36
960
原创 LangChain智能体开发全攻略:从零基础入门到实战精通,一篇搞定!
LangChain已发展为全面的智能体开发框架,提供从研发到部署的完整解决方案。核心组件包括Chains、Agents等,通过LangSmith实现调试追踪,LangGraph处理复杂控制流。涵盖Runnable接口、LCEL表达式语言、无状态与有状态系统区分,以及应用案例如聊天机器人和RAG系统。丰富的第三方工具集成使开发者能高效构建大模型应用。LangChain 在初期被人吐槽抽象复杂、API难用。现在已经逐渐成熟,发展成了一套从研发、调试到部署的很全面的框架,是入门智能体开发的好帮手。
2025-12-02 16:09:49
1307
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅