自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 【论文笔记】Families’ Vision of Generative AI Agents for Household Safety Against Digital and Physical Thr

本文通过定性研究揭示了家庭对 Generative AI agent 的真实期待:安全不应是监控,而应是嵌入日常照护角色中的协作支持。论文提出的多 agent 框架与隐私原则,为未来家庭 AI 系统设计与 Agent Safety 研究提供了重要的人本参考。Agent Memory 的隐私设计,与本文提出的四项标准结合。对齐本文提出的 MAS 框架设计和实现特定的 AI Agent demo。

2026-01-21 21:10:08 535

原创 【论文笔记】MasRouter: Learning to Route LLMs for Multi-Agent Systems

针对提到的问题,作者首次系统性的提出了一个问题:Multi-Agent System Routing(MASR)对于任意输入 query,在给定 LLM 池、角色池和协作模式集合的情况下,自动构建一个“性能—成本最优”的 MAS。Collaboration Mode Determination 选择合适的多智能体通信拓扑Agent Role Allocation 决定 agent 数量与角色组合Agent LLM Routing 为每个 agent 分配合适的 LLMSMRTSM。

2026-01-18 21:38:18 658

原创 【论文笔记】ADL: A Declarative Language for Agent-Based Chatbots

ADL 通过解耦智能体声明与 Python 编程,显著提升了 ToD 系统的可读性、可维护性和调试效率。ADL 的自然语言显式编程相较于 Python + 各种多智能体框架 + prompt 而言,更易被 开发者阅读,更简洁,且更易被LLM 理解,从这一角度出发,我们可能可以基于此开发一些更加上层的编程方式,区别于现在的 agent workflow 的各种编程方式,使其更易深入各行各业。声明式定义 仍需要 与 LLM 的基础能力配套设计。

2026-01-15 21:38:42 599

原创 【论文笔记】RAG MAKES GUARDRAILS UNSAFE? INVESTIGATING ROBUSTNESS OF GUARDRAILS UNDER RAG-STYLE CONTEXTS

作者提出一个不需要人工标注的新指标:Flip Rate(翻转率)定义为:当 guardrail 在 normal context 和 RAG-style context 下给出不同判断就记为一次 Flip。随着大模型从“单模型生成”逐步演进为系统级架构(LLM + Tool + RAG + Guardrails),安全机制本身正成为系统中的一个独立模块。简单的 Prompt 修改或增加推理能力是不够的,未来需要专门针对 RAG 场景训练更强韧的护栏模型。这也是本篇论文的切入点。

2026-01-13 21:56:09 651

原创 【论文笔记】RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for LLM

首次系统性证明:RAG 并不更安全,反而常常更危险。提出新的安全失败模式: safe model + safe docs→→揭示安全对齐的 “设置依赖性” 问题。证明现有的 red-teaming 方法对 RAG 不充分。RAG 不是 安全增强器,而是一个 “安全再分布器”,任何声称安全的 LLM,在进入 RAG / Agent 设置后,都必须重新接受安全评估。

2026-01-05 03:20:18 892

原创 【论文笔记】An Empathy-Based Sandbox Approach to Bridge the Privacy Gap

而这篇论文构建的沙盒环境则提供了一个零风险的训练场,它允许用户暂时“穿上”人工生成的虚拟角色的身份外衣,并在该角色的身份下体验各种隐私选择所带来的真实系统后果(例如,看到精准的定向广告)。通过这种角色扮演和共情 的方式,用户得以在没有泄露自己真实隐私数据的前提下,直观地感知隐私数据与系统结果之间的因果关系,从而有效地获取隐私知识和情感共鸣,最终促使他们做出与自身隐私目标相符的长期行为改变。如果广告重叠率低于 50%,则表明当用户切换角色时,超过一半的广告是独特的,证明沙盒的数据替换机制是有效的。

2025-11-28 20:21:55 744

原创 【论文笔记】REL-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance

如果一个药瓶(LLM)的标签(认知标记)正确地标明了药效(不确定性),但因为瓶子的设计(温暖度、历史表现)让人觉得它特别可靠,即使药效不明(中等确定性),用户仍可能会过度依赖,那么这个产品在现实世界的安全性就是存在问题的。也就是说,围绕模型的基础能力的评估并不能满足真实场景下的人机交互的安全需求,换句话说,基础能力的测试并未考虑到人的参与。上,即模型的预测概率是否与其准确率相匹配(例如,模型说有80%的把握,准确率是否确实为80%),换句话说就是 测评的是模型的基础能力(比如回答的正确率)。

2025-11-27 15:11:48 759

原创 【论文笔记】As Confidence Aligns: Exploring the Effect of AI Confidence on Human Self-confidence

这篇论文首次系统地探究了人工智能(AI)所表达的置信度(Confidence)如何影响人类的自信(Self-confidence),以及这种影响对人机协作决策有效性的后果。研究发现人类的自信会向 AI 的置信度靠拢(即“信心一致”),且这种一致性会影响人类的自信校准(Calibration)并降低人机决策的效率。

2025-10-27 01:41:44 643

原创 【论文笔记】Introduction to Explainable AI

狭义定义:使模型决策对人类可理解的技术与方法。广义定义(“可理解 AI”):涵盖对模型、数据、性能、输出范围、局限性等全方位的透明化。

2025-10-17 12:35:27 865

原创 【论文笔记】Fostering Appropriate Reliance on Large Language Models

本研究采用混合方法,系统地识别并量化了LLM回应的三个关键特征(解释、来源、不一致性)对用户信任的影响。明确了解释会普遍增加信任,而来源和不一致性是减少过度信任的有效机制。提供了关于用户如何解释LLM解释、如何进行来源点击以及解释和来源之间交互作用的细致见解。

2025-10-10 01:38:02 862

原创 【论文笔记】Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

论文引入了两种与人类社会动态相似的智能体特质:“随和型”(easy-going)和“过度自信型”(overconfident)。适应性强,与不同类型的智能体兼容,有助于形成和谐的社会结构。倾向于高估自身能力,忽视潜在风险,并抵制他人意见。论文探讨了两种多轮协作下的思维模式:“辩论”(debate)和“反思”(reflection)。多个智能体提出观点,交换意见,进行集体论证并最终达成共识。这种模式促进知识共享和学习。智能体回顾自己之前的回答,从中吸取经验并相应地优化其答案。

2025-09-03 15:55:35 1086

原创 【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation

研究只考虑了英文,并不支持多语言生成只关注了小说故事生成,并未考虑其他艺术风格该文章中的复杂叙事结构,其实就是把 生成的 Outline 在扩写后,交给 LLM 重构了 Outline 的顺序,这样不能解决实际问题,只是表面上的工作,该处可以参考中对于复杂叙事结构的描述,或许有参考价值。生成长度为 4000 字,并不能很好的解决小说的故事生成,还是个 toy。

2025-08-16 23:08:46 1238 1

原创 【论文笔记】Multi-Agent Based Character Simulation for Story Writing

故事生成,多智能体系统,角色模拟。

2025-08-16 21:54:35 1501 1

原创 【论文笔记】STORYTELLER: An Enhanced Plot-planning Framework for Coherent and Cohesive Story Generation

生成内容虽长(平均 7594 词),但深度和复杂度仍不及人类创作的完整小说。更别提网文长度的小说。生成内容仍缺乏经典文学作品的深度与复杂性。缺乏专业的故事质量评测基准(需结合叙事理论设计新指标)。现有指标(如人类偏好)存在主观性。当前实验集中于一般叙事,需验证在奇幻/科幻等复杂体裁的表现。

2025-08-14 22:25:13 1157

原创 【论文笔记】DOC: Improving Long Story Coherence With Detailed Outline Control

DOC框架通过详细提纲生成器和详细控制器的双重机制,显著改善了长篇故事生成的连贯性。将创作负担从生成阶段转移到规划阶段:通过层次化详细提纲提供更可靠的全局指引实现精细的生成控制:确保生成内容忠实于详细提纲,同时保持创造性建立高效的人机协作模式:在高层次规划阶段与人类互动,而非逐段干预低层次提纲遵循:无法始终严格遵循提纲的所有细节事实一致性:角色名称、性别等基本事实可能出现不一致提纲质量波动:提纲叶节点在细节层次上不一致风格问题:重复使用角色全名等小问题。

2025-08-13 19:41:03 1205

原创 【论文笔记】AGENTS’ ROOM: NARRATIVE GENERATION THROUGH MULTI-STEP COLLABORATION

协作优于单一模型:将复杂任务分解并由专业代理协作完成,比单一模型一次性生成更有效。结构化优于自由生成:基于叙事理论的结构化生成,比自由生成更能保证故事质量。人类评估仍是金标准:尽管自动化评估取得进展,但人类对故事质量的判断仍是不可替代的。这一研究为创意写作辅助系统、教育工具和娱乐内容生成等领域提供了重要的技术基础和理论指导。

2025-08-09 00:53:52 1303

原创 【环境配置】KAG - Windows 安装部署

KAG-Windows 部署

2025-07-11 20:51:58 1622 3

原创 【论文笔记】BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation

摘要: 复旦大学团队提出BookWorld系统,通过多智能体模拟将静态小说文本转化为动态交互世界。该系统从小说中提取角色画像、世界观设定和地理结构,构建角色智能体(自主决策)和世界智能体(全局调度),支持角色驱动的故事生成。核心创新包括:1)增量式角色关系更新与四元组世界观建模;2)基于地理图的动态路径规划与事件触发;3)记忆检索机制增强行为连贯性。实验表明,BookWorld生成的故事在角色一致性和情节创意性上优于基线方法。代码已开源,适用于创意写作与沉浸式叙事应用。 (字数:149)

2025-07-03 20:04:23 1017 1

原创 【环境配置】Neo4j Community Windows 安装教程

由于 Neo4j Desktop 实操下来存在无法打开等问题,所以选择使用 Neo4j Community。本教程安装的版本为 Neo4j 5.26.8,JDK 版本为,操作系统为 Windows 11。

2025-07-01 21:30:34 816

原创 【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization

SecAlign: Defending Against Prompt Injection with Preference Optimization - CSS 25

2025-06-01 01:22:02 1807 1

原创 【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation

2025-05-25 17:42:34 1066 1

原创 【论文笔记】Exploring Large-Scale Language Models to Evaluate EEG-Based Multimodal Data for Mental Health

GPT-4o 一次调用内置图像+文本解析能力,简化管道设计。无需专门微调,提示工程即可达接近传统机器学习水平的性能。实验证明将 EEG 与视觉/音频结合,可捕捉更多互补信息,提升心理状态识别精度。

2025-04-27 00:20:54 845 1

原创 【论文笔记】HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficie

向量知识库与知识图谱的结合

2025-03-27 15:11:57 1199 1

原创 【论文笔记】CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph

CogMG通过LLM与KG的协作,既减少了LLM的“幻觉”,又解决了KG的知识覆盖问题。

2025-03-17 22:05:33 1242 2

原创 【论文笔记】Best Practices and Lessons Learned on Synthetic Data for Language Models

Best Practices and Lessons Learned on Synthetic Data for Language Models

2025-03-12 19:24:11 977 1

原创 【LeetCode】LCR 139. 训练计划 I

教练使用整数数组 actions 记录一系列核心肌群训练项目编号。为增强训练趣味性,需要将所有奇数编号训练项目调整至偶数编号训练项目之前。请将调整后的训练项目编号以 数组 形式返回。

2025-02-19 22:14:55 465

原创 【论文笔记】Identifying malicious traffic under concept drift based on intraclass consistency enhanced vae

Identifying malicious traffic under concept drift based on intraclass consistency enhanced variational autoencoder

2025-02-19 21:10:58 1420 1

原创 【LeetCode】LCR 121. 寻找目标值 - 二维数组

【LeetCode】LCR 121. 寻找目标值 - 二维数组

2025-02-17 14:40:08 1127

原创 【LeetCode】LCR 120. 寻找文件副本

数组 - 简单设备中存有 n 个文件,文件 id 记于数组 documents。若文件 id 相同,则定义为该文件存在副本。请返回任一存在副本的文件 id。示例 1:输入:documents = [2, 5, 3, 0, 5, 0]输出:0 或 5。

2025-02-16 19:49:28 735

原创 【论文笔记】On Generative Agents in Recommendation

推荐系统中离线指标与线上效果的长期脱节问题制约了行业发展。本文提出基于大语言模型的用户模拟器 Agent4Rec,模拟真实用户行为,弥合离线与在线评估的鸿沟。

2025-02-16 18:09:09 1623 1

原创 【scikit-multiflow】使用 scikit-multiflow 的流数据生成器生成概念漂移数据流

使用 scikit-multiflow 的流数据生成器生成不同类型的概念漂移数据流

2025-02-15 21:17:46 1078

原创 【LangChain】Chapter12 -Chat

Chatbot

2025-02-03 00:16:18 515

原创 【LangChain】Chapter11 - Question Answering

Question Answering

2025-02-02 22:35:30 1127

原创 【LangChain】Chapter10 - Retrieval

《LangChainChatwithYourData》-Retrieval

2025-01-19 21:12:18 736

原创 【LangChain】Chapter9 - Vectorstores and Embeddings

《LangChain Chat with Your Data》- Vectorstores and Embeddings

2025-01-17 12:02:59 856

原创 【LangChain】Chapter8 - Document Splitting

《LangChain Chat with Your Data》-Document Splitting

2025-01-16 01:16:52 1219

原创 【LangChain】Chapter7 - Document Loading

《LangChain Chat with Your Data》-Document Loading

2025-01-14 20:35:38 835

原创 【LangChain】Chapter6 - Agents

本节简单介绍了一下什么是 agent,讲解了如何使用 LangChain 搭建一个 agent,对两个工具进行了演示,并介绍了如何自己构建工具的过程。

2025-01-13 16:29:20 1277

原创 【LangChain】Chapter5 - Evaluation

本节介绍了使用 LangChain 对 LLM 问答应用进行评估。

2025-01-13 13:54:34 988

原创 【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)

【Seed-Labs 2.0】Buffer Overflow Attack Lab (Server Version)

2025-01-04 16:22:39 2196

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除