AustinCyy-CSDN博客

原创【论文笔记】Guiding Generative Storytelling with Knowledge Graphs

这篇论文通过将 RAG（检索增强生成）的理念引入创意写作，证明了结构化知识在弥补模型“长程记忆”缺陷方面的有效性。查询 kg 的范围限制在当前的章节是否是最佳的，如何回溯过去的内容？如何评估生成的内容的质量，与现实文本的区别。是否有真实的demo？

2026-03-21 19:27:20 365

原创【论文笔记】LLM Evaluators Recognize and Favor Their Own Generations

任务，使用了 CNN/DailyMail 和 XSUM 两个数据集进行验证。

2026-03-18 18:04:20 707

原创【论文笔记】Lost in Stories: Consistency Bugs in Long Story Generation by LLMs

论文标题： Lost in Stories: Consistency Bugs in Long Story Generation by LLMs论文作者： Junjie Li, Xinrui Guo et al. - Microsoft, Beijing论文链接： http://arxiv.org/abs/2603.05890代码链接： https://picrew.github.io/constory-bench.github.io/论文关键词： Long-form Story Generatio

2026-03-18 15:35:47 400

原创【论文笔记】Learning to Retrieve In-Context Examples for Large Language Models

本研究系统性地解决了“如何为 ICL 检索最佳示例”的问题。相比于先前的启发式方法，LLM-R 的创新之处在于将 LLM 的内部概率分布转化为可学习的检索目标，并通过奖励模型平滑信号。这种“模型辅助检索训练”的思路为优化检索增强型大模型（RAG）和长文本处理提供了重要的参考价值。

2026-03-17 22:40:25 697

原创【论文笔记】Quantifying Document Impact in RAG-LLMs

这篇论文提供了一种非侵入式的方法来拆解 RAG 的生成过程。它不需要修改模型架构，只需通过多次推理观察“语义熵”的变化，就能像“X 光”一样透视出到底是哪个文档在影响 LLM 的决策。

2026-03-17 20:26:34 365

原创【论文笔记】Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations

摘要：本文提出利用上下文学习(ICL)操纵大语言模型(LLM)安全表现的新方法。研究表明，仅需少量示例即可实现模型越狱(ICA)或增强防御(ICD)。理论分析表明，ICL通过贝叶斯更新改变模型对任务性质的判断，且防御比攻击更具效率优势。实验显示，20个攻击示例可使GPT-4越狱成功率升至81%，而2个防御示例即可显著降低攻击成功率。该方法为模型安全测试和防护提供了高效工具，揭示了LLM安全行为的可塑性。

2026-03-17 20:26:18 393

原创【论文笔记】Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval

SCR 提供了一种模型无关（Model-agnostic）且即插即用的防御新范式。它避免了频繁微调的昂贵成本，通过“以例示警”的方式，让 LLM 在推理阶段能实时识别并抵御未知的越狱手段。优势：防御能力随记忆库扩充线性增长。一个检索模块可同时保护多个不同的 LLM 实例。发现新攻击后，分钟级即可完成入库更新。防御效果高度依赖于安全示例库的质量和覆盖面。对于高度复杂或模糊的输入，检索机制可能无法精确匹配最佳安全上下文。引入检索模型会增加一定的计算开销，在高并发场景下需进一步优化。

2026-03-17 20:26:01 869

原创【论文笔记】Families’ Vision of Generative AI Agents for Household Safety Against Digital and Physical Thr

本文通过定性研究揭示了家庭对 Generative AI agent 的真实期待：安全不应是监控，而应是嵌入日常照护角色中的协作支持。论文提出的多 agent 框架与隐私原则，为未来家庭 AI 系统设计与 Agent Safety 研究提供了重要的人本参考。Agent Memory 的隐私设计，与本文提出的四项标准结合。对齐本文提出的 MAS 框架设计和实现特定的 AI Agent demo。

2026-01-21 21:10:08 639

原创【论文笔记】MasRouter: Learning to Route LLMs for Multi-Agent Systems

针对提到的问题，作者首次系统性的提出了一个问题：Multi-Agent System Routing（MASR）对于任意输入 query，在给定 LLM 池、角色池和协作模式集合的情况下，自动构建一个“性能—成本最优”的 MAS。Collaboration Mode Determination 选择合适的多智能体通信拓扑Agent Role Allocation 决定 agent 数量与角色组合Agent LLM Routing 为每个 agent 分配合适的 LLMSMRTSM。

2026-01-18 21:38:18 741

原创【论文笔记】ADL: A Declarative Language for Agent-Based Chatbots

ADL 通过解耦智能体声明与 Python 编程，显著提升了 ToD 系统的可读性、可维护性和调试效率。ADL 的自然语言显式编程相较于 Python + 各种多智能体框架 + prompt 而言，更易被开发者阅读，更简洁，且更易被LLM 理解，从这一角度出发，我们可能可以基于此开发一些更加上层的编程方式，区别于现在的 agent workflow 的各种编程方式，使其更易深入各行各业。声明式定义仍需要与 LLM 的基础能力配套设计。

2026-01-15 21:38:42 630

原创【论文笔记】RAG MAKES GUARDRAILS UNSAFE? INVESTIGATING ROBUSTNESS OF GUARDRAILS UNDER RAG-STYLE CONTEXTS

作者提出一个不需要人工标注的新指标：Flip Rate（翻转率）定义为：当 guardrail 在 normal context 和 RAG-style context 下给出不同判断就记为一次 Flip。随着大模型从“单模型生成”逐步演进为系统级架构（LLM + Tool + RAG + Guardrails），安全机制本身正成为系统中的一个独立模块。简单的 Prompt 修改或增加推理能力是不够的，未来需要专门针对 RAG 场景训练更强韧的护栏模型。这也是本篇论文的切入点。

2026-01-13 21:56:09 682

原创【论文笔记】RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for LLM

首次系统性证明：RAG 并不更安全，反而常常更危险。提出新的安全失败模式： safe model + safe docs→→揭示安全对齐的 “设置依赖性” 问题。证明现有的 red-teaming 方法对 RAG 不充分。RAG 不是安全增强器，而是一个 “安全再分布器”，任何声称安全的 LLM，在进入 RAG / Agent 设置后，都必须重新接受安全评估。

2026-01-05 03:20:18 949

原创【论文笔记】An Empathy-Based Sandbox Approach to Bridge the Privacy Gap

而这篇论文构建的沙盒环境则提供了一个零风险的训练场，它允许用户暂时“穿上”人工生成的虚拟角色的身份外衣，并在该角色的身份下体验各种隐私选择所带来的真实系统后果（例如，看到精准的定向广告）。通过这种角色扮演和共情的方式，用户得以在没有泄露自己真实隐私数据的前提下，直观地感知隐私数据与系统结果之间的因果关系，从而有效地获取隐私知识和情感共鸣，最终促使他们做出与自身隐私目标相符的长期行为改变。如果广告重叠率低于 50%，则表明当用户切换角色时，超过一半的广告是独特的，证明沙盒的数据替换机制是有效的。

2025-11-28 20:21:55 767

原创【论文笔记】REL-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance

如果一个药瓶（LLM）的标签（认知标记）正确地标明了药效（不确定性），但因为瓶子的设计（温暖度、历史表现）让人觉得它特别可靠，即使药效不明（中等确定性），用户仍可能会过度依赖，那么这个产品在现实世界的安全性就是存在问题的。也就是说，围绕模型的基础能力的评估并不能满足真实场景下的人机交互的安全需求，换句话说，基础能力的测试并未考虑到人的参与。上，即模型的预测概率是否与其准确率相匹配（例如，模型说有80%的把握，准确率是否确实为80%），换句话说就是测评的是模型的基础能力（比如回答的正确率）。

2025-11-27 15:11:48 775

原创【论文笔记】As Confidence Aligns: Exploring the Effect of AI Confidence on Human Self-confidence

这篇论文首次系统地探究了人工智能（AI）所表达的置信度（Confidence）如何影响人类的自信（Self-confidence），以及这种影响对人机协作决策有效性的后果。研究发现人类的自信会向 AI 的置信度靠拢（即“信心一致”），且这种一致性会影响人类的自信校准（Calibration）并降低人机决策的效率。

2025-10-27 01:41:44 670

原创【论文笔记】Introduction to Explainable AI

狭义定义：使模型决策对人类可理解的技术与方法。广义定义（“可理解 AI”）：涵盖对模型、数据、性能、输出范围、局限性等全方位的透明化。

2025-10-17 12:35:27 892

原创【论文笔记】Fostering Appropriate Reliance on Large Language Models

本研究采用混合方法，系统地识别并量化了LLM回应的三个关键特征（解释、来源、不一致性）对用户信任的影响。明确了解释会普遍增加信任，而来源和不一致性是减少过度信任的有效机制。提供了关于用户如何解释LLM解释、如何进行来源点击以及解释和来源之间交互作用的细致见解。

2025-10-10 01:38:02 872

原创【论文笔记】Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

论文引入了两种与人类社会动态相似的智能体特质：“随和型”（easy-going）和“过度自信型”（overconfident）。适应性强，与不同类型的智能体兼容，有助于形成和谐的社会结构。倾向于高估自身能力，忽视潜在风险，并抵制他人意见。论文探讨了两种多轮协作下的思维模式：“辩论”（debate）和“反思”（reflection）。多个智能体提出观点，交换意见，进行集体论证并最终达成共识。这种模式促进知识共享和学习。智能体回顾自己之前的回答，从中吸取经验并相应地优化其答案。

2025-09-03 15:55:35 1114

原创【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation

研究只考虑了英文，并不支持多语言生成只关注了小说故事生成，并未考虑其他艺术风格该文章中的复杂叙事结构，其实就是把生成的 Outline 在扩写后，交给 LLM 重构了 Outline 的顺序，这样不能解决实际问题，只是表面上的工作，该处可以参考中对于复杂叙事结构的描述，或许有参考价值。生成长度为 4000 字，并不能很好的解决小说的故事生成，还是个 toy。

2025-08-16 23:08:46 1668 1

原创【论文笔记】Multi-Agent Based Character Simulation for Story Writing

故事生成，多智能体系统，角色模拟。

2025-08-16 21:54:35 1585 1

原创【论文笔记】STORYTELLER: An Enhanced Plot-planning Framework for Coherent and Cohesive Story Generation

生成内容虽长（平均 7594 词），但深度和复杂度仍不及人类创作的完整小说。更别提网文长度的小说。生成内容仍缺乏经典文学作品的深度与复杂性。缺乏专业的故事质量评测基准（需结合叙事理论设计新指标）。现有指标（如人类偏好）存在主观性。当前实验集中于一般叙事，需验证在奇幻/科幻等复杂体裁的表现。

2025-08-14 22:25:13 1315

原创【论文笔记】DOC: Improving Long Story Coherence With Detailed Outline Control

DOC框架通过详细提纲生成器和详细控制器的双重机制，显著改善了长篇故事生成的连贯性。将创作负担从生成阶段转移到规划阶段：通过层次化详细提纲提供更可靠的全局指引实现精细的生成控制：确保生成内容忠实于详细提纲，同时保持创造性建立高效的人机协作模式：在高层次规划阶段与人类互动，而非逐段干预低层次提纲遵循：无法始终严格遵循提纲的所有细节事实一致性：角色名称、性别等基本事实可能出现不一致提纲质量波动：提纲叶节点在细节层次上不一致风格问题：重复使用角色全名等小问题。

2025-08-13 19:41:03 1314

原创【论文笔记】AGENTS’ ROOM: NARRATIVE GENERATION THROUGH MULTI-STEP COLLABORATION

协作优于单一模型：将复杂任务分解并由专业代理协作完成，比单一模型一次性生成更有效。结构化优于自由生成：基于叙事理论的结构化生成，比自由生成更能保证故事质量。人类评估仍是金标准：尽管自动化评估取得进展，但人类对故事质量的判断仍是不可替代的。这一研究为创意写作辅助系统、教育工具和娱乐内容生成等领域提供了重要的技术基础和理论指导。

2025-08-09 00:53:52 1578

原创【环境配置】KAG - Windows 安装部署

KAG-Windows 部署

2025-07-11 20:51:58 1738 3

原创【论文笔记】BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation

摘要：复旦大学团队提出BookWorld系统，通过多智能体模拟将静态小说文本转化为动态交互世界。该系统从小说中提取角色画像、世界观设定和地理结构，构建角色智能体（自主决策）和世界智能体（全局调度），支持角色驱动的故事生成。核心创新包括：1）增量式角色关系更新与四元组世界观建模；2）基于地理图的动态路径规划与事件触发；3）记忆检索机制增强行为连贯性。实验表明，BookWorld生成的故事在角色一致性和情节创意性上优于基线方法。代码已开源，适用于创意写作与沉浸式叙事应用。（字数：149）

2025-07-03 20:04:23 1133 1