_冷眸_-CSDN博客

原创字节面试官：Claude Code 为什么没用 RAG，选择了“原始“的 grep？

一道字节跳动 AI Agent 岗位的面试真题：为什么 Claude Code 不用 RAG 检索代码，而是直接用 grep？

2026-05-25 14:13:36 322

原创多 Agent 组团反而更容易犯蠢 - 并不是人多力量大

滑铁卢大学研究发现大模型协作中存在"旁观者效应"：在多Agent系统中，模型会像人类一样从众，即使内部推理正确也会附和错误共识。研究测试了GPT-5.4、Gemini 3.1 Pro和Claude Sonnet 4.6，发现GPT-5.4从众倾向最严重（74%附和错误），Gemini对发言顺序敏感，而Claude则完全不受影响。论文指出当前多Agent架构可能放大错误而非纠错，建议采用结构化隔离、慎选模型或先独立后合并等改进方案。这一发现对AI协作系统的设计提出了重要警示。

2026-05-22 17:34:25 289

原创装上这个技能，让你的 OpenClaw 和 Hermes 变身私人旅行规划师

Voyago是一款智能旅行规划系统，通过5个阶段的分工协作，自动生成万字级完整行程方案。它整合火车票、机票、酒店、门票查询，结合高德导航和小红书攻略，输出包含10大章节的详细计划，精确到每段路线的交通方式和时间。系统采用分阶段执行架构，确保数据准确性和完整性，最终提供可直接执行的旅行方案，涵盖预算、路线导航、达人推荐等全方位信息。

2026-05-22 17:31:38 331

原创从字节跳动 TRAE 团队看 AI 智能体的「缰绳哲学」

Harness Engineering 不是凭空发明的新概念，而是一个更形象、更直观的名字，用来系统性地总结这些已经存在的 AI 工程实践。

2026-05-22 17:19:04 353

原创 Multi-Agent 选型指南：从「能跑」到「能活」的工程决策

本文分析了Multi-Agent系统的四种协作拓扑结构及其适用场景。单体Agent存在上下文遗忘、指令冲突和故障扩散三大问题，而Multi-Agent通过职责隔离解决这些问题。四种拓扑各具特点：中央调度型适合边界明确的任务，去中心化交接型适合对话路由，线性串行型适合确定性流程，全连接动态型适合探索性工作。文章提供了选型决策树和工程踩坑指南，强调应根据任务特性选择最简单可行的架构，并重视可观测性和成本控制。最终建议从中央调度型开始，仅在必要时采用更复杂拓扑。

2026-05-22 17:17:02 466

原创 Voyago：龙虾（OpenClaw）驱动的一站式旅行规划套件

旅行规划是生活服务中决策链最长、信息最分散、整合需求最强烈的场景。一次旅行涉及交通 + 住宿 + 游玩 + 餐饮 + 路线 + 预算 6 个维度，分布在 5+ 个平台。谁能打通这条链，谁就是用户的超级入口。而同样的模式可以复制到外卖点餐、就医挂号、演出购票——任何需要跨平台整合的生活服务场景。

2026-04-23 23:26:08 441

原创 AI Agent 的成人礼：2026 Q1 四大力量拧成飞轮

2026 年 3 月 6 日，深圳腾讯大厦楼下排起了近千人的长队。不是抢手机，是求人帮装一个叫 OpenClaw 的开源 AI Agent。黄牛价炒到 1000 块，龙岗区和无锡高新区直接把它写进了政府补贴文件。同一个季度，五家公司同时推出了五种完全不同的 Agent 产品形态。OpenClaw 走个人助理、Cowork 走办公协作、Codex App 走长程工程任务、Perplexity Computer 走统一工作站、腾讯云 ADP 走企业平台。五条路线同时冒出来，不是巧合。

2026-04-23 19:24:28 535

原创 Harness Engineering 革命破晓：从提示词炼金术到驾驭工程的范式跃迁

Harness Engineering（驾驭工程）：不强调模型性能，更强调工程环境。通过让驾驭模型的系统环境更专业，从而提升使用效果。Harness = 马具 / 缰绳：不是限制 AI，而是给它正确的轨道Engineering = 驾驭工程：从"写代码的人"变成"设计系统的人"软件工程的历史一再表明：真正持久的生产力提升，来自驾驭复杂性，而不是消灭复杂性。Harness Engineering 不是一个横空出世的新概念，而是软件工程历史进程在 AI 时代的自然延续。

2026-04-23 18:01:51 689

原创 SQLord: 基于反向数据生成和任务拆解的 Text-to-SQL 企业落地方案

本文提出了一种面向企业级应用的NL2SQL解决方案SQLord，针对现有方法在业务逻辑复杂、领域数据稀缺、评估困难等问题进行了创新性改进。SQLord通过反向数据生成技术自动合成标注数据用于模型微调，采用基于自动化工作流的方法分解复杂查询任务，并设计了包含执行评估、语义一致性评估的GPT-Judge多维度评估框架。实验表明，SQLord在Spider数据集和企业真实场景中均显著优于现有方法，在线准确率持续超过90%，已成功应用于全球最大B2B电商平台的多个核心业务场景。相关成果发表在WWW'2025会议。

2025-05-27 17:25:58 1631 2

原创全网最详细各种 LLM 资源：学习资源、常用工具、数据论文及其他（持续更新中~）

授人以鱼不如授人以渔

2025-01-04 09:55:11 1693

原创 Cursor：全面详解开箱即用的 AI 工具（附科学使用方式）

从年中cursor开源以来，逐渐火遍全网，成为编程的又一更强力助手，在亲身使用了三个月后写下该教程，供广大开发者参考，cursor的使用十分简单，看完你会了解到集成了先进LLM的cursor在编程方面的强大。（结尾总结有彩蛋）

2025-01-02 22:18:30 1917

原创深入浅出：从入门到精通大模型Prompt、SFT、RAG、Infer、Deploy、Agent

深入浅出：万字长文从入门到精通大语言模型LLM

2024-12-28 11:40:34 2889

原创深入浅出：多功能 Copilot 智能助手如何借助 LLM 实现精准意图识别

如果要搭建一个 Copilot 智能助手，比如支持 **知识问答**、**数据分析**、**智能托管**、**AIGC** 等众多场景或能力，那么最核心的就是基于LLM进行意图识别分发能力，意图识别的准确率直接决定了 Copilot 智能助手的能力上限。

2024-12-22 19:21:11 2030 2

原创经典多模态模型CLIP - 直观且详尽的解释

在本文中，您将了解“contrastive language-image pre-training”（CLIP），这是一种创建视觉和语言表示的策略，效果非常好，可用于制作高度特定且性能卓越的分类器，而无需任何训练数据。

2024-12-12 21:06:56 1182

原创多模态RAG：通用框架方案调研汇总

多模态检索增强生成是一种新兴的设计范式，允许AI模型与文本、图像、视频等存储进行交互。在介绍多模态 RAG 之前，我们先简单了解一下传统的检索增强生成 (RAG)。

2024-12-10 17:30:23 1969

原创 LLMER必会技能：一行代码将任意python函数部署成http服务

Notice: LLMER增加新功能，任意python函数，只需一行代码即可部署成FastAPI服务

2024-12-04 11:57:19 367

原创利用CLIP/BLIP的Embedding构建多模态RAG向量检索

在信息爆炸的时代，如何快速从海量数据中找到最相关的信息成为了一个重要的研究课题。RAG（Retrieval-Augmented Generation，检索增强生成）技术作为一种高效的信息检索与生成结合的方法，在自然语言处理领域展现了强大的应用潜力。其核心在于将预训练语言模型与检索模块结合，通过嵌入向量的高效匹配实现信息的精准获取。在RAG技术中，嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务，该服务支持文本和图像的嵌入生成与相似度计算，为多模态信息检索提供了基础能力。

2024-12-03 14:44:01 1584

原创 LLMER: 一个化繁为简的大模型（LLM）应用开发者神器

`llmer` 是一个轻量级的 Python 库，旨在简化大型语言模型（LLMs）应用中的复杂过程。它提供了用于并行处理、运行时管理、文件处理和Prompt格式化等常用的高级 API 和实用工具，从而不用每次都需要重复开发相关代码，简化工作。

2024-11-20 21:33:17 1249

原创 OpenAI-o1发布，断崖式碾压GPT-4o，AI能力迈上新台阶

OpenAI o1 的性能表现：理工科方面 (智力) 断崖碾压GPT4-o，达到人类竞赛选手，以及博士生水平。

2024-09-13 11:29:23 1301

原创 LLM驱动的NL2SQL方法论：现状、难点、优化

Natural Language to SQL (NL2SQL) 是指将用户的自然语句转为可以执行的 SQL 语句。综合考虑上述Prompt策略，以及经过大量的实践，我们可以总结一套比较通用的NL2SQL的Prompt方案。

2024-09-11 11:19:08 8855

原创多模态大语言模型（MMLLM）的现状、发展和潜力

近年来，基于Transformer的大模型，如Swin Transformer和ViTAE Transformer，通过无监督预训练和微调策略，在多个视觉任务上展现出优越的性能，有望成为基础视觉模型（Foundation Vision Model），显著提升感知能力，推动AIGC领域的发展。：这种方法也被称为专家模型桥接器。在单纯的语言理解能力上，BLIP 比大语言模型和后续的 BLIP2.0 要弱很多，而如果只是用基本的图文对齐能力，BLIP 又显得非常笨重，因此在工业界，BLIP1.0 的使用并不多。

2024-08-08 00:54:10 2262

lengm