- 博客(28)
- 收藏
- 关注
原创 字节面试官:Claude Code 为什么没用 RAG,选择了“原始“的 grep?
一道字节跳动 AI Agent 岗位的面试真题:为什么 Claude Code 不用 RAG 检索代码,而是直接用 grep?
2026-05-25 14:13:36
322
原创 多 Agent 组团反而更容易犯蠢 - 并不是人多力量大
滑铁卢大学研究发现大模型协作中存在"旁观者效应":在多Agent系统中,模型会像人类一样从众,即使内部推理正确也会附和错误共识。研究测试了GPT-5.4、Gemini 3.1 Pro和Claude Sonnet 4.6,发现GPT-5.4从众倾向最严重(74%附和错误),Gemini对发言顺序敏感,而Claude则完全不受影响。论文指出当前多Agent架构可能放大错误而非纠错,建议采用结构化隔离、慎选模型或先独立后合并等改进方案。这一发现对AI协作系统的设计提出了重要警示。
2026-05-22 17:34:25
289
原创 装上这个技能,让你的 OpenClaw 和 Hermes 变身私人旅行规划师
Voyago是一款智能旅行规划系统,通过5个阶段的分工协作,自动生成万字级完整行程方案。它整合火车票、机票、酒店、门票查询,结合高德导航和小红书攻略,输出包含10大章节的详细计划,精确到每段路线的交通方式和时间。系统采用分阶段执行架构,确保数据准确性和完整性,最终提供可直接执行的旅行方案,涵盖预算、路线导航、达人推荐等全方位信息。
2026-05-22 17:31:38
331
原创 从字节跳动 TRAE 团队看 AI 智能体的「缰绳哲学」
Harness Engineering 不是凭空发明的新概念,而是一个更形象、更直观的名字,用来系统性地总结这些已经存在的 AI 工程实践。
2026-05-22 17:19:04
353
原创 Multi-Agent 选型指南:从「能跑」到「能活」的工程决策
本文分析了Multi-Agent系统的四种协作拓扑结构及其适用场景。单体Agent存在上下文遗忘、指令冲突和故障扩散三大问题,而Multi-Agent通过职责隔离解决这些问题。四种拓扑各具特点:中央调度型适合边界明确的任务,去中心化交接型适合对话路由,线性串行型适合确定性流程,全连接动态型适合探索性工作。文章提供了选型决策树和工程踩坑指南,强调应根据任务特性选择最简单可行的架构,并重视可观测性和成本控制。最终建议从中央调度型开始,仅在必要时采用更复杂拓扑。
2026-05-22 17:17:02
466
原创 Voyago:龙虾(OpenClaw)驱动的一站式旅行规划套件
旅行规划是生活服务中决策链最长、信息最分散、整合需求最强烈的场景。一次旅行涉及交通 + 住宿 + 游玩 + 餐饮 + 路线 + 预算 6 个维度,分布在 5+ 个平台。谁能打通这条链,谁就是用户的超级入口。而同样的模式可以复制到外卖点餐、就医挂号、演出购票——任何需要跨平台整合的生活服务场景。
2026-04-23 23:26:08
441
原创 AI Agent 的成人礼:2026 Q1 四大力量拧成飞轮
2026 年 3 月 6 日,深圳腾讯大厦楼下排起了近千人的长队。不是抢手机,是求人帮装一个叫 OpenClaw 的开源 AI Agent。黄牛价炒到 1000 块,龙岗区和无锡高新区直接把它写进了政府补贴文件。同一个季度,五家公司同时推出了五种完全不同的 Agent 产品形态。OpenClaw 走个人助理、Cowork 走办公协作、Codex App 走长程工程任务、Perplexity Computer 走统一工作站、腾讯云 ADP 走企业平台。五条路线同时冒出来,不是巧合。
2026-04-23 19:24:28
535
原创 Harness Engineering 革命破晓:从提示词炼金术到驾驭工程的范式跃迁
Harness Engineering(驾驭工程):不强调模型性能,更强调工程环境。通过让驾驭模型的系统环境更专业,从而提升使用效果。Harness = 马具 / 缰绳:不是限制 AI,而是给它正确的轨道Engineering = 驾驭工程:从"写代码的人"变成"设计系统的人"软件工程的历史一再表明:真正持久的生产力提升,来自驾驭复杂性,而不是消灭复杂性。Harness Engineering 不是一个横空出世的新概念,而是软件工程历史进程在 AI 时代的自然延续。
2026-04-23 18:01:51
689
原创 SQLord: 基于反向数据生成和任务拆解的 Text-to-SQL 企业落地方案
本文提出了一种面向企业级应用的NL2SQL解决方案SQLord,针对现有方法在业务逻辑复杂、领域数据稀缺、评估困难等问题进行了创新性改进。SQLord通过反向数据生成技术自动合成标注数据用于模型微调,采用基于自动化工作流的方法分解复杂查询任务,并设计了包含执行评估、语义一致性评估的GPT-Judge多维度评估框架。实验表明,SQLord在Spider数据集和企业真实场景中均显著优于现有方法,在线准确率持续超过90%,已成功应用于全球最大B2B电商平台的多个核心业务场景。相关成果发表在WWW'2025会议。
2025-05-27 17:25:58
1631
2
原创 Cursor:全面详解开箱即用的 AI 工具(附科学使用方式)
从年中cursor开源以来,逐渐火遍全网,成为编程的又一更强力助手,在亲身使用了三个月后写下该教程,供广大开发者参考,cursor的使用十分简单,看完你会了解到集成了先进LLM的cursor在编程方面的强大。(结尾总结有彩蛋)
2025-01-02 22:18:30
1917
原创 深入浅出:多功能 Copilot 智能助手如何借助 LLM 实现精准意图识别
如果要搭建一个 Copilot 智能助手,比如支持 **知识问答**、**数据分析**、**智能托管**、**AIGC** 等众多场景或能力,那么最核心的就是基于LLM进行意图识别分发能力,意图识别的准确率直接决定了 Copilot 智能助手的能力上限。
2024-12-22 19:21:11
2030
2
原创 经典多模态模型CLIP - 直观且详尽的解释
在本文中,您将了解“contrastive language-image pre-training”(CLIP),这是一种创建视觉和语言表示的策略,效果非常好,可用于制作高度特定且性能卓越的分类器,而无需任何训练数据。
2024-12-12 21:06:56
1182
原创 多模态RAG:通用框架方案调研汇总
多模态检索增强生成是一种新兴的设计范式,允许AI模型与文本、图像、视频等存储进行交互。在介绍多模态 RAG 之前,我们先简单了解一下传统的检索增强生成 (RAG)。
2024-12-10 17:30:23
1969
原创 LLMER必会技能:一行代码将任意python函数部署成http服务
Notice: LLMER增加新功能,任意python函数,只需一行代码即可部署成FastAPI服务
2024-12-04 11:57:19
367
原创 利用CLIP/BLIP的Embedding构建多模态RAG向量检索
在信息爆炸的时代,如何快速从海量数据中找到最相关的信息成为了一个重要的研究课题。RAG(Retrieval-Augmented Generation,检索增强生成)技术作为一种高效的信息检索与生成结合的方法,在自然语言处理领域展现了强大的应用潜力。其核心在于将预训练语言模型与检索模块结合,通过嵌入向量的高效匹配实现信息的精准获取。在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。
2024-12-03 14:44:01
1584
原创 LLMER: 一个化繁为简的大模型(LLM)应用开发者神器
`llmer` 是一个轻量级的 Python 库,旨在简化大型语言模型(LLMs)应用中的复杂过程。它提供了用于并行处理、运行时管理、文件处理和Prompt格式化等常用的高级 API 和实用工具,从而不用每次都需要重复开发相关代码,简化工作。
2024-11-20 21:33:17
1249
原创 OpenAI-o1发布,断崖式碾压GPT-4o,AI能力迈上新台阶
OpenAI o1 的性能表现:理工科方面 (智力) 断崖碾压GPT4-o,达到人类竞赛选手,以及博士生水平。
2024-09-13 11:29:23
1301
原创 LLM驱动的NL2SQL方法论:现状、难点、优化
Natural Language to SQL (NL2SQL) 是指将用户的自然语句转为可以执行的 SQL 语句。综合考虑上述Prompt策略,以及经过大量的实践,我们可以总结一套比较通用的NL2SQL的Prompt方案。
2024-09-11 11:19:08
8855
原创 多模态大语言模型(MMLLM)的现状、发展和潜力
近年来,基于Transformer的大模型,如Swin Transformer和ViTAE Transformer,通过无监督预训练和微调策略,在多个视觉任务上展现出优越的性能,有望成为基础视觉模型(Foundation Vision Model),显著提升感知能力,推动AIGC领域的发展。:这种方法也被称为专家模型桥接器。在单纯的语言理解能力上,BLIP 比大语言模型和后续的 BLIP2.0 要弱很多,而如果只是用基本的图文对齐能力,BLIP 又显得非常笨重,因此在工业界,BLIP1.0 的使用并不多。
2024-08-08 00:54:10
2262
原创 全网最简洁 Code Agent,50行代码极速入门,带你通往AGI!
在人工智能领域,Code Agent不仅是技术进步的一个标志,更是我们迈向人工通用智能(AGI)的关键一步。AGI旨在创造能够执行任何智能任务的AI,而Code Agent的能力——自动编写和优化代码——是实现这一目标的基石之一。通过自动处理复杂的编程任务,Code Agent不仅提高了软件开发的效率,更重要的是,它使机器能够理解和执行与软件开发相关的高级认知任务,这是向AGI过渡的必要条件。
2024-07-25 13:34:50
1391
原创 吴恩达揭示 Generative AI:打破知识壁垒,普惠全人类
生成式人工智能(AI)是近年来迅速发展的一个领域,它主要基于监督学习技术。在2010到2020年间,大规模监督学习技术的发展为现代AI技术奠定了基础。
2024-07-13 00:05:19
1113
原创 吴恩达揭示 Generative AI:打破知识壁垒,普惠全人类
生成式人工智能(AI)是近年来迅速发展的一个领域,它主要基于监督学习技术。在2010到2020年间,大规模监督学习技术的发展为现代AI技术奠定了基础。
2024-07-12 23:13:58
1856
原创 微软企业级 AI 框架 Semantic Kernel 详解,LangChain 最强替代
Semanic Kernel 是微软开源的一个轻量级的开源开发套件,它让你可以轻松构建 AI Agent,并将最新的 AI 模型集成到您的 C#、Python 或 Java 代码库中;它提供了一个简单易用的 API,可以连接到各种 AI 服务,例如 OpenAI、Azure OpenAI 和 Hugging Face 等;并且它作为业高效的中间件,能够快速交付企级解决方案。
2024-07-07 14:09:45
5824
原创 一文教你面对高并发任务时如何选择:多进(线)程 VS 异步函数
在现代软件开发中,处理高并发和网络I/O密集型任务是一个常见的挑战。Python提供了多种方法来处理并发,其中最常用的是多进(线)程和异步编程。本文将探讨这两种技术在实际应用中的性能差异,并通过实验来比较它们在处理大量网络请求时的效率。
2024-06-29 20:58:04
1335
原创 Code Interpreter: 使用PandoraBox和LangGraph构建的Agent
我们将进一步探讨如何利用PandoraBox和LangGraph构建一个功能强大的Code Interpreter。这个项目采用了单Agent模式,旨在为开发者提供一个高效、灵活的代码解释工具。
2024-06-26 19:35:07
1541
原创 Pandora Box: Code Interpreter平替,Python驱动Agent最佳选择
在大型语言模型(LLMs)的时代,Pandora Box作为一款开创性的开源Python包,旨在赋能开发者和创新者创建基于LLM的应用程序和Agent。这一多功能工具旨在提供一个健壯且安全的Python环境,便于无缝集成和执行LLM驱动的项目。Pandora Box完全免费,通过pip install即可轻松安装。
2024-06-25 10:31:30
1591
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅