一、分支叙事生成的新范式
在人工智能领域,大语言模型(LLM)的应用已经渗透到创意写作的方方面面。然而,如何让AI生成具有多重可能性的分支叙事,一直是一个具有挑战性的课题。传统的方法往往依赖于人工预设分支点,或是完全依赖用户输入来推动故事发展,这些方法要么限制了故事的可能性,要么容易导致故事偏离原有主题。宾夕法尼亚大学的研究团队最近提出了一种突破性的解决方案——WHAT-IF(Writing a Hero’s Alternate Timeline through Interactive Fiction)系统,该系统通过创新性地运用元提示(meta-prompting)技术,实现了高质量的分支叙事自动生成。这项研究不仅为交互式小说创作开辟了新的可能性,更为Prompt工程师提供了一个全新的技术范式。
如图1所示,WHAT-IF系统提供了简洁的用户界面,允许用户输入主角名称、故事标题和原始剧情。系统以此为基础,自动生成具有多个分支可能性的交互式故事。
【图1:WHAT-IF系统的用户界面。用户可以输入主角、标题和故事情节,图中展示了使用WandaVision电视剧情节作为输入的示例。】这里我选择了项目的截图。
二、从经典规划到语言模型
故事生成技术的发展历程反映了人工智能领域的重要进步。在早期,故事生成主要依赖于经典规划方法。这些系统通过从情节点图中提取计划来生成故事,能够确保故事情节的长期连贯性,但缺乏自然语言生成能力。
随着大语言模型的出现,故事生成领域迎来了新的突破。现代语言模型(尤其是GPT系列)在生成流畅、富有创意的故事方面展现出了惊人的能力。研究者们开始探索如何通过提示工程来控制故事生成,包括使用大纲扩展、关键词引导等方法。一些研究还尝试将检索增强技术引入故事生成过程。
在交互式叙事生成领域,研究者们同样进行了广泛的探索。传统方法主要依赖规划技术,而近期的研究开始尝试使用神经网络来生成交互式小说的世界、场景和分支任务。特别值得注意的是,一些研究者开始探索如何利用大语言模型来生成用户选择,这为WHAT-IF系统的设计提供了重要的参考。
三、系统架构:五阶段的精密设计
WHAT-IF系统的核心架构包含五个主要阶段,每个阶段都经过精心设计,以确保生成的分支叙事既保持连贯性,又富有创意。如图3所示,系统的工作流程包括从原始剧情到最终游戏生成的完整过程,通过分支创建和合并来构建丰富的故事世界。
【图3:WHAT-IF系统架构图。展示了从原始剧情到交互式游戏的完整工作流程:(1)初始化分支剧情树;(2)提取关键事件;(3)生成元提示;(4)生成新的分支事件;(5)将新事件组织成树结构;(6)合并到现有树中;(7)生成最终的游戏叙事。】
第一阶段:分支剧情树的初始化
在这个阶段,系统首先将输入的线性故事转化为一个结构化的分支剧情树。如图4所示,这个树状结构的每个节点都包含四个关键元素:
【图4:分支剧情树的节点结构图。每个节点包含状态(S)、目标(G)、关键决策(KD)和替代决策(AD),边上包含事件序列E={e1,e2,e3}。】
-
角色当前状态(State):描述角色在当前情节点的具体处境
-
角色目标(Goal):角色在当前状态下试图达成的目标
-
原始故事中的关键决策(Key Decision):角色在原始故事中做出的推动情节发展的决定
-
可能的替代决策(Alternate Decision):在相同状态和目标下,角色可能做出的其他合理决定
每条边包含的三个事件被设计为完整的句子,以确保叙事的连贯性:
-
角色做出的决定:以"[角色名]决定…"的形式呈现
-
决定导致的后续事件:描述决定的直接结果
-
角色的下一个状态:作为连接下一个节点的过渡
系统使用JSON格式来存储这个树状结构,确保数据的规范性和可处理性。如图2所示,系统通过递归方式不断添加分支,最终形成一个完整的二叉树结构。这种结构化的设计不仅便于系统处理,也为后续的分支生成提供了清晰的框架。
【图2:分支剧情树的生成过程图。从原始剧情p1开始,系统递归地添加替代情节,直到形成完整的二叉树结构。】
第二阶段:关键事件提取
系统在这个阶段采用了经典的三幕剧结构理论,这种结构将故事分为三个主要阶段:设置、对抗和解决。系统从原始故事中提取三个关键事件:
引发事件(Inciting Incident):
-
将主角拉出日常世界的转折点
-
通常出现在第一幕结束时
-
标志着故事真正开始
危机(Crisis):
-
主角面临的最大挑战
-
出现在第二幕结束时
-
通常涉及主角的重要抉择
高潮(Climax):
-
故事的最终对决或转折点
-
发生在第三幕
-
代表故事张力的最高点
系统使用特定的提示来识别这些关键事件,确保提取的事件真正代表故事的重要转折点。这些事件随后被用作生成分支故事的锚点,确保新生成的故事线也具有类似的戏剧性结构。
第三阶段:元提示生成
这是WHAT-IF系统最具创新性的部分。系统使用GPT-4来生成针对每个分支点的定制化提示,这些元提示包含以下要素:
- 基于原始故事情节的具体引导问题:
-
探讨替代决策对角色发展的影响
-
考虑对故事主题的影响
-
分析对关键事件的改变
- 对新分支的结构要求:
-
如何保持与原有关键事件的联系
-
如何构建新的戏剧性冲突
-
如何维持故事的整体平衡
- 输出格式规范:
-
事件列表的具体格式
-
每个事件的描述要求
-
故事长度控制
系统会根据当前分支点的具体情况动态调整这些元提示的内容,确保生成的提示既能保持故事的连贯性,又能激发创意的分支发展。
第四阶段:分支生成与合并
在这个阶段,系统使用生成的元提示来创建新的故事分支,并将其整合到现有的剧情树中。这个过程是递归的,包含以下步骤:
-
提取原始故事线的所有事件
-
使用元提示生成新的事件序列
-
将新事件组织成分支
-
将新分支与现有剧情树合并
-
从新的故事线提取关键事件
-
为新节点生成元提示
-
递归地继续分支生成过程
这种递归的方法确保了每个分支都能保持与原始故事相似的质量和深度。
第五阶段:叙事生成
最后一个阶段将分支剧情树转化为可交互的故事体验。系统为每个节点生成:
-
前序事件的叙事描述
-
角色当前状态和目标的说明
-
两个可选决策的描述
这些内容最终被编译成Ink脚本,创建一个完整的交互式小说游戏。
四、元提示技术的创新应用
WHAT-IF系统在元提示技术的应用上展现出了独特的创新。传统的提示工程通常依赖于固定的模板或人工设计的提示,而元提示则允许系统根据具体故事内容动态生成最适合的提示。这种方法带来了几个显著的优势:
上下文感知的提示生成
系统能够根据故事的具体内容和当前分支点的特征,生成高度相关的提示。这些提示不仅包含必要的格式要求,还包含了对故事主题、角色发展和情节转折的深入理解。例如,当系统需要为一个关键决策点生成分支时,元提示会自动考虑:
-
这个决策对角色后续发展的影响
-
如何保持故事的主题一致性
-
新分支如何与原有的关键事件产生呼应
-
如何确保新生成的内容在逻辑上是合理的
结构化的故事控制
通过在元提示中融入三幕剧结构的要求,系统能够在保持创意自由的同时,确保生成的故事具有良好的结构。这种平衡是通过以下机制实现的:
-
为每个分支点生成具体的引导问题
-
确保新分支与原有关键事件的关联
-
维持故事的节奏和张力
-
在适当的位置设置情节转折
质量控制机制
元提示还包含了一系列质量控制机制,确保生成的内容符合预期:
-
明确的格式要求
-
对故事长度的控制
-
主题一致性的检查
-
角色动机的合理性验证
五、系统优势与局限性
显著优势
- 高度的故事连贯性 WHAT-IF系统生成的分支故事能够很好地保持与原始故事的主题一致性,同时又不失创新性。这主要得益于:
-
基于角色状态和目标的决策生成
-
元提示对故事结构的精确控制
-
递归的分支生成过程
- 可控的创意空间 系统通过元提示技术,在保持创意自由度的同时,确保生成的内容不会偏离原有故事的核心。这种平衡是通过以下机制实现的:
-
动态生成的具体引导问题
-
对关键事件的保留和变异
-
结构化的分支生成过程
- 良好的用户体验 最终生成的交互式小说能够为用户提供:
-
有意义的选择
-
连贯的故事发展
-
令人满意的结局
现有局限
- 计算资源消耗 系统在生成完整的故事树时需要大量的GPT-4调用,这带来了:
-
较高的运行成本
-
较长的生成时间
-
对API访问的依赖
- 生成内容的不可预测性 尽管有严格的控制机制,但由于依赖大语言模型,系统仍可能产生:
-
意外的情节发展
-
潜在的有害内容
-
不完全可控的输出
六、对Prompt工程师的启示
WHAT-IF系统的设计和实现为Prompt工程师提供了很多有价值的启示:
元提示的应用价值
- 动态提示生成 元提示技术展示了一种新的提示工程范式,它能够:
-
根据具体场景动态生成提示
-
自适应地调整提示的细节
-
实现更精确的输出控制
- 结构化控制 通过在元提示中嵌入结构化的要求,可以:
-
确保输出的质量
-
维持内容的连贯性
-
实现复杂的生成任务
实践建议
- 系统设计 在设计类似系统时,建议:
-
采用分阶段的处理流程
-
建立清晰的数据结构
-
实现必要的质量控制机制
- 提示设计 在设计提示时,应该考虑:
-
上下文的重要性
-
结构化要求的必要性
-
质量控制的机制
七、写在最后
WHAT-IF系统的成功实现表明,元提示技术在复杂的生成任务中具有巨大的潜力。这种技术不仅适用于分支叙事生成,还可能在其他需要精确控制和创意平衡的领域发挥重要作用。对于Prompt工程师来说,这项研究提供了一个全新的技术视角,值得在实践中进行更深入的探索和应用。
八、如何系统学习掌握AI大模型?
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份
全面的AI大模型学习资源
,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享
!
1. 成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
2. 大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
3. 大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
4. 2024行业报告
行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
5. 大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
6. 大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以
微信扫描下方CSDN官方认证二维码
,免费领取【保证100%免费
】