再论大模型做内容消费

前言

今天咱们再体验几个有关大模型聚集内容创作的工作。

之前也专门介绍过一些大模型在该方面的工作,感兴趣的小伙伴可以穿梭:《提升大模型内容创作能力》:https://zhuanlan.zhihu.com/p/716240950

废话不多说,一起来看看吧!

MidReal

体验网址:https://midreal.ai/

其是一个AI互动小说,用户可以实时选择剧情走向创作,而且MidReal支持长篇剧情,保持连贯性。还支持多种语言、多模态等等。

废话不多说,我们直接体验一下试试,你只要输入一个简单的剧情大纲,其便可以开始进行创作,笔者一共试了两个:

以第一个为例,输入的是“用户看到哈士奇在疯狂拆家,进行教育,但是二哈各种不听话,还是各种拆家”,那么它就开始进行了创作,会给出主人公,过程中还会对应的生成一些插图,下面是笔者随便截的几张效果图

它不是一下创作完整个剧情,而是在生成一部分后停止,进而给出一些不同的剧情走向供你选择,或者自定义剧情如下

除了生成剧情外,还可以实时选择和剧情中的人物进行聊天

整体体验下来就是这种新的互动模式很好玩,不论是剧情还是聊天都可实时参与,但是目前的效果(笔者只试了中文)感觉还是很英文感,汉化的不够好,相信后面慢慢优化,这种互动式的内容创作还是很好玩的。

IBSEN

论文链接:https://arxiv.org/html/2407.01093v1

github: https://github.com/OpenDFM/ibsen

该篇论文提出了一个<导演-演员>协同框架

这篇文章提出了IBSEN,其模拟现实生活中拍电影的流程即导演-演员模式。导演负责决定演员出场的顺序和对话脚本,而演员则需要根据导演的指示进行实际表演。

同时用户作为玩家,可以随时参与进来,打断某一剧情,这个时候导演需要临场发挥,随机应变即根据用户的互动实时调整剧本,进而指示演员进行配合,其最终目的就是既要配合好用户又要让剧情朝着预设的方向发展,不偏离主线。

可以看到其实整个过程就是一个控制框架,而各个节点的控制其实就是通过prompt来完成的,作者在附录都也给出来了。

为了便于理解,笔者跑了一下官方的demo,下面我们一起看下。

官方一共给了两种体验方式mzgame_frontend.py和terminal_frontend.py,前者是一个游戏脚本,其做了一些前端交互等等,使得其体验更有趣如下,感兴趣的小伙伴可以自己跑着玩一下。

笔者直接尝试跑了一下terminal_frontend.py即纯终端的交互。其大概的剧本是Hedda Gai正要举办一场发布会内容是关于Eilert的死讯,而给用户的设定是一名叫做Edward Helson的记者。游戏一开始是你可以输入不同的数字进入不同的剧情比如1代表酒店走廊、2代表酒店大堂、3代表新闻发布厅、你还可以输入-1进行随机采访某个人如下:

这里笔者是选择输入个1,那便可以得到一段剧情发展(绿色框),可以看到陆续有四个演员登场,其中Hedda Gai和George Dai进行一波寒暄,John和Peter则是讨论了下这场发布会的内容。

紧接着红色框又是给用户进行新的选择。

这次笔者选择-1进行主动采访(如下图),然后它让我选择具体想采访的人,笔者选了1也即Hedda Gai。然后让输入想采访的问题,笔者输入了“你看起来心情不错啊”,Hedda Gai回答的大概意思就是为了面子总得装装。笔者觉得不应该这样,Hedda Gai回答这就是我们的不同点。最后笔者不想采访了直接选择0进行退出,它会让接着选择是否想采访其他人,笔者也不想采访了,直接选择0进行退出。

退出后,它又让开始选择剧情,笔者这会选择3即新闻发布厅,它接着就会出现新的演员进行剧情推动。

接下来就又是同样的选择进行互动了,笔者就不再过多演示了。相信大家通过上面的例子已经大概了解到游戏是什么样子了,感兴趣的小伙伴可以去尝试一下。

  • 跑demo提示

想跑通demo的小伙伴可能会遇到一些坑,笔者这里也记录一些debug遇到的,希望能帮的上。

(1)首先代码中用到了guidance这个包,其因为一些版本的问题可能和openai的调用会出现一些diff。首先就是改guidance/llms/_openai.py的652行的将stop这里改成列表即[stop]

(2)其次就是guidance/llms/_openai.py的157行改为chat_mode = True,因为chat_model_pattern这里还没有gpt-40-mini,其会检查是不是chat模型,其实这里不需要检查,直接用就行,所以都改成TRUE

(3) 其次就是issiue区提到的一个问题,大家直接按着修复就行:https://github.com/OpenDFM/ibsen/issues/1

(4)还有就是ibsen本身的代码director.py的150行next_instruction = ""单独设置为空,上面已经返回值,这个为空导致query为空报错,可以注释掉这一行试试,https://github.com/OpenDFM/ibsen/blob/main/server/director.py#L150

总结

(1)IBSEN的好处是控制了内容中的人物,但是缺点是需要预先设置好基本的剧情甚至细节。这部分还是需要人力的。而MidReal则是给一个基本大纲便可自动持续的创作剧情以及可以实时调控剧情走向,但是聊天的不够好,如果能把二者工作结合起来进行内容创作是不是更好呢?

(2)目前demo的中文效果都不怎么好,如果能针对中文场景进行一番优化,说不定是一个不错的大模型落地。

关注笔者

知乎csdngithub微信公众号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值