闲话人工智能系列02:AI大胸弟帮我写了13000多字的魔幻图文小说

作者·夏虫

『数据虫巢』

全文6898

题图·AI绘图

8657221b8a5b2f98acb1bc429a849a63.png

 教员曾说过,没有调查就没有发言权。对AI到底能做到什么程度,其实我也很好奇,但我很少主动去说什么,尝试去证明什么--因为我还没有去调研。但雾里看花花不见,水中望月月难寻,不如自己拨开迷雾,亲自下水走一遭。

PS:提示,本篇我会用“文生图”的实践举例子,并附上文生图的一些技巧和经验,以及中间穿插对于AI的更深一步的理解,最后做了AI写小说的尝试和探索,甚至让AI写了一篇完整故事脉络的魔幻小说作为打底,来讲述AI写小说的一些技巧和探索过程吧,希望对于广大读者朋友们一些参考。

正如上一篇《闲话人工智能系列01:到底有多少智能,还需要多少人工》所言,被身边的各种现象所触动,并且自己的团队也算是脚边沾水,湿了点点鞋,为海外业务素材自动化流转,做了一些图片方向的智能化应用的逻辑,挨了边。

这才让我决定自己下场深入的去了解这个领域,到底能做到什么程度,可能哪怕我自己去看了,去做了,去尝试了,也只是在边缘溜达了一圈,但好歹比站在高处“挥斥方遒,指点江山”来的强。

并且,这篇也是笔者老夏自己的一些实践,然后总结一些规律给到需要的读者朋友们,我喜欢称之为“技法”。大部分都是普通玩家可以去尝试的点,以做到老夏目前大概做到的程度。

我们依然先从“文生图”这个场景入手。

a5c4d313b734349a0a01b6ffc2464b05.png

e6aca5586a2565b353d5b7a56824c6aa.png

01

文生图生视频

其实在上一章节里,我们已经开始行动去探索LLM引擎到底能做到哪一步,尝试了不少国内的AI产品,大体上能够做到一个系列一个风格的去文生图,甚至能够做到依赖于故事,去配置插图的程度。

这里依然再次提下,后面的重点还是总结一些有用的技巧给到读者朋友们,当做是自己的一些总结和梳理,也给有一些有兴趣玩玩的朋友一些参考建议。

比如,我们【AI图文微故事】视频号中的“图说《桃花源记》”,基本上60%左右吧,把桃花源记的过程通过图给呈现出来了,还是蛮有意思的(不过有安徽的读者说桃花源记,其实讲的是一个鬼故事,着实把我吓了一跳)。

你看,我说的其实很保守,60%的情节还原,其实已经很不错了。但确实存在不少问题,比如一些复杂场景很难还原,涉及到多人的场面,就容易乱掉。

后面又再进行了一些技法总结,以及不同AI产品的尝试和摸索,再次输出了一个“图说《逍遥游》”的视频。

感兴趣的可以看下,你会发现其实跟“逍遥游”的故事还原了更多,大体上比较难找到一些比较明显的槽点了,甚至一些画面是超出了我的意想之外的(其实很难完全把控的,AI就是很多Surprise,当然更多是不达标的图)。

比如视频中,朝菌与蟪蛄与渲染(那种水墨画的感觉,是真的不错),还有大椿树的构思,实际上是超出了我的提示Prompt之外的,着实有点惊喜。

8de7d9ff7190a89762ae5ee5a7a8b574.jpeg比如这里对于朝菌(苔藓)与蟪蛄(蝉,或者类似的昆虫)的融合以及渲染,我相信很多原生的插画师要做到这种程度都需要费一点点功夫。0a65169419d1991b8f3fc037d5e28cb0.jpeg还有这头大椿树,我大体上是根据Prompt技巧,但核心是按逍遥游中描绘这株参天大树的,并且中间做了一些不断的加强(比如,让他大点,再大点之类的--是不是有点像金箍棒),当时的我是没让他这种构图的--尼玛直接缠绕在了山巅上,这构图创意直接把我帅哭了。

总感觉很多原生插画师要失业了,或者,赶紧拥抱AI吧。

回到这里的话题,首先,个人感觉用来做内容插画,真的是能达到70%的水准了。当然,文生图,大体上依然比较难去精细控制,所以,他目前其实他适合的是那种非严肃型的,可以适当有畅想空间的场景自动配图(这种场景其实很多的,要求并没有那么精准,反而需要创意)。

说到创意,就有了上面的“大椿”,本身也体现了目前大部分AI产品的现状--精细化控制不足。精细化控制不足,那就创意来凑。但底层的逻辑其实也不完全是创意,而是他很难很精准的理解到输入“文”的表达意图,所以必然会融入很多随机的因子在里头了,从而呈现出这种创意的Surprise。

所以,关于文生图,老夏这里有一些建议和想法是可以稍稍做分享的。

第一,不要把AI当人看,要当驴来使。其实我们系列01有提到我对AI的看法,他当前并不能做到很精细的听话,要把它当“驴”来使,量大管够才是用AI真正的姿势。

所以,说多了都是泪,在视频号【AI图文微故事】里的一些画面,很多是矮个子里挑高个,拖拉机里挑战斗机挑出来的。但好在他反应速度够快,让他多十几次咯。

第二,适用于留有一定想象空间的场景。适用场景决定了你做这件事的天花板上限。如上面所说,正是他目前还做不到那么精细化的控制,所以他的适用场景往往是一些留有创意空间发挥的场景里,比如一些故事里配图插画,一些谁都没有实锤的场景和画面还原。

比如,老夏上面发的,你见过大鲲,你见过大鹏,你见过大椿吗?你看,谁都没有见过,在画个八九不离十的时候,拼的就是创意和想象力了。类似这种场景,非常之适合(我顿时感到,以后杂志、小说、故事什么的插画师是不是要失业了)。

第三,属于平台选择以及试验层面的技巧。不说MJ和SD,其实国内已经有很多很多支持文生图的免费AI产品了,甚至SD还开源出来让你自己搭一个。整体而言,国内的没有国外的好使,免费的不如收费的好用。

但是,依然可以帮助你完成大部分的工作,只需要多试几次以及摸索一些技巧。不聊收费的,只聊免费的。大部分产品其实都是偏科的,对于某个风格的理解其实很不同,所以上来你需要先定位你需要大概什么风格的,然后固定这个风格提示词,先摸索不同平台对于这个风格的输出情况(Test阶段)。

然后找到一个符合你调性的平台,保持住系列风格的提示词不动,变动其他的Prompt变量,大概率在一段时间内,会输出相同风格的图,看着像一个完整系列。

比如上面的逍遥游,桃花源记,还有一个没有贴出来的很典型的“山海经系列”,看着都是一个插画师画出来的。

第四,依然是技法层面的,Prompt技巧。大部分国内的免费的AI产品,其实都是笨笨的,他对于NLP的理解都没有Chatgpt强,但所谓的文生图,本质上是先从文中提取出对于画的理解要素,最终结合这些要素去绘画。

你看,所谓的落后从第一步就开始了。因此,我们要扬长避短,在玩文生图的时候不要学跟Chatgpt聊天似的。

几个原则请记牢:
(1)能实体化,尽量实体化描述,不要跟他玩虚的,臆想的,需要联想的,他真的不够聪明,会给你乱画的。
(2)把你最想表达的主体部分放在前面,其他乱七八糟要放在后面,不然他会主次不分的。
(3)关于实体,不要串联,尽量一个词一个词往外蹦,帮他断词断句,助于他理解,因为他太蠢,要简化的逻辑。
(4)画复杂关系的时候,开始可以让他先画主体部分,然后一点一点的通过交互式的逻辑去优化,比如让他额外修正,添加元素呀。就是把他当小孩,不要一下子灌输那么多东西,理解不了,要引导他。
(5)善用一些产品逻辑本身提供的反馈机制,比如一般都有点赞或者评估画的好不好,那里好那里不好,构图,元素,风格?

大体上就这些了,做到这些,最起码视频号上的那些东西,大体上是可以做到的了,甭管他是国产的还是进口的,白嫖的还是付钱的。

又回到之前聊的一个画,基于这种观点,其实Dirty的活已经外包给了AI兄弟了,那么人干什么?判断,总结技法,用好工具,构思创意。

所以,沿着这个思路,我已经不满足于静态的图去讲述一个景点故事了,我要创造故事。怎么创造故事,故事创意+动画特效+剪辑=特效故事短片。

比如上面这段,不要误会,这不是大片,这只是4秒钟通过Runway生成的动画特效,原始输入是之前“画出李白的诗”系列中的“黄河之水天上来天上来”。
8338feef3e4d4f642ecf8425e20cf88d.jpeg虽然只有短短的几秒钟,但配上我找了有一会儿的黄河水声的素材资源,一下子那种直面滔滔黄河水的感觉就出来了,不比一副静态图+文字的感触强?

如果我们通过创意,组成不同的这种几秒钟的短动画,再设计好剧情,再配上BGM,再来点旁白,这尼玛不就是科幻大片的宣传片吗?

好了,我接下来要干这个事了,等着我,给古文配画已经满足不了躁动的小宇宙了(立个Flag,目标70%,要做就做至少70分位的事,60分要求太低,80分要求太专业,我只取70分就满足了,等着哈)。

但是,做这个之前,我还是想看看AI兄弟到底能不能帮我写篇小说,想当年,我在纵横网上可是连载了小30万字才“太监”的呢?

来,帮我圆一圆我的文青梦吧!

3c9dfb5c1187ad98eb1d2f1bb13496d3.png

d117cb36c9e5fc3c4b0b86a3ea9118b2.png

02

AI兄弟写了一篇13000多字的小说

先说结局,在聊做法和技法,以及过程--他真的帮我写了一篇13000多字的魔幻小说。

先声明下,老夏我从0几年就玩魔兽争霸,从魔兽争霸3到冰封王座,从QQ对战平台到当年的天梯1500分选手。再有后面的魔兽世界(听说要从网易那里代理回归了?),他的几乎所有的官网的非官方的背景小说,野史小说都看过了。就连2016年拍的那么烂的《魔兽》电影,我都看了2遍。

总之,我是个魔兽题材爱好者,设定控,背景架构控。既然如此,何不满足于我呢,我的AI大胸弟。

明目张胆的去抄神兽世界的设定那是万万不行的,要被搞的,所以我假设的背景:
是一个叫古老的阿拉斯大陆(你懂的)在天崩地裂之后,保留下来的一片最大的大陆“雷泽大陆”,而大陆出现的“永恒水晶”(不是王者荣耀,请不要乱入)导致了上古原住民人族、精灵以及兽族们不再适应,逐渐的离开了,只留下一些少量的其他坚强的智慧种族。并且,在永恒水晶的影响下,一些非智慧种族,比如一些野兽动物等,逐渐产生了智慧,并诞生了新的文明。

你看,一下子就跟之前的一些大伙儿想象中的东西做了一些剥离,但好像又有点儿关系,一个纯粹动物与智慧人族结合的全新种族体系就出现了,而永恒水晶如此好使,作为一种战略资源,又形成了主线的冲突路径(我简直要被我的设定架构能力所折服了)。

291d6c15c0af8597813fcb0346e9e37d.jpeg而我们的故事就发生在这么一个大背景下,大的世界架构有了,剩下就是怎么去构建一个不那么长,但是又有一定情节和趣味性的中短篇了。

你敢相信,我是先让AI大胸弟随机生成了一个类似于神兽世界逻辑的地图,然后剩下所有的构思都是在有了图之后,再逐步填补上来的吗(我真的有写设定架构的天赋的,感觉点错了理工科技能树,哈哈,当年我选理科的时候,我的文科老师还找我,让我回心转意来着)。ad1c2255bc8807efed0388895af271c6.jpeg
PS:这是故事开头,刚游历大陆从北方归来的熊猫人战士陈,正式他带回了整篇故事的起源--龙冢遗迹意外出现龙牙晶的消息。

其他的先不说,为了写这个,我专门开了一个公号【AI图文微故事】(其实是早年玩公众号剩下的,还有好几个呢,什么评论、留言功能齐全的,现在申请可不好申请,所以凡事得快)。

好兄弟就请先关注一波(后续类似的,我都会发到那个号)。如果是你看不起联盟狗,那么我们就是好兄弟,一起高喊“兽人永不为奴”,然后关注一波。如果你对面的是部落猪,那么我们还是好兄弟,一起高喊“为了联盟”,然后关注一波。总之,关注一波,哈哈,开个玩笑。

结合之前说的AI大胸弟用来做70分的插画师还是可以做的,单纯的写小说估计大概拼不过传统小说家,文不够,图来凑,来帮助读者深入奇境,迂回作战。

上主菜《雷泽大陆传说系列:龙牙晶-暗潮来临》,看完文章记得回来看如何构思和让AI大胸弟帮忙写的,来一起探讨过程。

回到这里,总结下就是,可能跟传统的小说作者写的比,确实笔法不足,但是36张的插图+13000字,最起码文风是没跑的,魔幻题材笔法和逻辑。整个故事大体完整,也有一些转折和小高潮,最终故事是完整的,但又留下了悬念,为这个大的架空世界留下下一篇的可能性(总算,没有白瞎我这么宏大的世界设定)。

总之,这可能是一篇65分的中短篇小说(故事基本完整,章节基本清晰,有大致的高潮和转折,有伏笔),但配上36张我精心(AI随意画)的图之后,通篇就有70分位线了。

关键在于,36张图+13000字,不算构思和过程提示的话,我修改的幅度不超过2%,算是AI原创了吧--这事可以搞(我会继续写的,说错了,让AI大胸弟继续帮我写的,请多关注)。

你看,只要你有构思,有奇思妙想,基于目前的这些AI工具,是可以写小说的。当然,你还得有技法,我们来聊技法。

我们的AI大胸弟编外枪手要上岗了。

20cee27ae396144450636da4df633a9c.png

ff85e2a12acf0d247a037077aff4c1d3.png

03

AI大胸弟枪手上岗

开始我是很忐忑的。分别让文心一言兄弟,智普兄弟和Kimi兄弟展示了一下自己在写小说上的才能,最终我翻了清华智普的牌子。

直接说技巧吧。

第一,让AI大胸弟告诉你他需要什么。如果你需要让AI兄弟写小说,你就告诉他,你想写什么类型的小说,需要我给他什么样的内容。

于是,他跟我说,直接写小说,老夫做不到,你要这样。

要创作一篇类似《神兽世界》风格的魔幻小说,以下是我可能需要你提供的一些关键信息和元素:

1. **世界设定**:
  - 描述小说发生的世界观,包括地理环境、历史背景、文化特色等。
  - 种族和文明的详细介绍,例如人类、兽人、暗夜精灵等的特点和文化。   - 重要的地点和地标,如城市、森林、山脉、神庙等。

2. **角色设定**:
  - 主要角色和配角的背景故事、性格特点、外貌描述和动机。
   - 角色之间的关系网络,如盟友、敌对、家族关系等。

3. **情节大纲**:
   - 故事的基本情节,包括起始事件、冲突、高潮和解决方案。
   - 重要的剧情转折点和悬念设置。

4. **魔法和技能系统**:
   - 描述小说中的魔法体系,包括不同类型的魔法、施法者和魔法物品。
   - 技能和战斗系统,如战士、法师、盗贼等职业的技能和战斗方式。

5. **宗教和神话**:
   - 描述小说中的宗教信仰、神祇和神话传说。
   - 宗教组织和神职人员的设定。

6. **政治和社会结构**:
   - 描述不同种族和城邦的政治体系和社会等级。
   - 描述重要的政治事件和社会冲突。

7. **敌对势力**:
   - 描述主要的反派角色或势力,包括他们的目标、动机和行动方式。
   - 敌对势力与主角之间的矛盾和冲突。

8. **重要的象征和主题**:
   - 故事想要探讨的主题,如勇气、牺牲、荣誉、背叛等。
   - 故事中的象征元素,如特定的物品、生物或事件的象征意义。

9. **风格和语言**:
   - 期望的写作风格,如史诗、哥特、幽默等。
   - 特定的语言和对话风格,如正式、俚语、诗意等。

10. **其他要求**:
    - 特定的长度要求,如短篇、中篇或长篇。
    - 是否需要包含特定的元素或避免某些内容。

这么复杂,还不如我自己写算了,但实际上真不是,13000字,会让我写吐血的,而不是短短一两天我就丢出来这些东西。

第二,如果你想控制剧情,故事大纲尽量详细,甚至章节里发生什么事,都写清楚。因为,如若不如此,他会真的天马行空的,结果会让整个剧情漏洞很多。

说白了就是,你要控住主线,剩下才是AI大枪手发挥的空间,文笔,组织语言等等。又回到了第1章节说的,AI大胸弟其实目前并没有那么聪明,所以需要约束。

第三,按章节不断优化。开始,他可能会给你一篇很短的出来,比如这13000多字,AI大枪手刚开始写的只有1000多字的,在我的虚心教导下,以及诱惑(引导)以及批评下(告诉他,那些不好,那些删掉重来),最终才有13000的基本完整的故事。

第四,关联关系技巧。在背景设定那里,人物设定那里,一定要把人物特点鲜明化,以及跟其他人物之间的关系谱要体现出来,这样一些关联细节大枪手填充的时候才会更丰满。

第五,写完之后还可以改,甚至交给另外一个AI枪手兄弟,让他帮忙看看。比如我写完了,我就让Kimi兄弟帮我润色了一番(Kimi支持txt导入理解)。

我让Kimi兄弟看完了清华堂兄弟智普的作品之后,他表示还可以优化优化。于是,我又跟Kimi两人讨论一番,甚至拿出了部分感觉不是那么好的章节深入的“探讨”了一番。

最终,这一篇“神兽世界”风格的《雷泽大陆传说系列:龙牙晶-暗潮来临》就出来了,希望对各位看官有所帮助。

5f2c29b85a539dfa12c2887122c518fe.png

在故事的最后,只留下荒芜的龙冢遗迹背景,以及从东面怒涛海吹来的狂风,我们的寒鸦先知、北方守护者,结局究竟如何,以及龙牙晶到底会不会引起雷泽大陆的腥风血雨,请听下回分解。

夏虫评说

AI的图片绘制能力,以及可扩展性,弥补了故事本身的不足,但也很考验作者对于故事的架构能力,当然还有一些跟AI合作的技法。

总之,笔者老夏感觉,真的是非常有意思的一个方向和领域,老夏我会继续尝试探索下去,包括【AI图文微故事】这个公号,会继续跟AI合作下去,续写“雷泽大陆”的故事,请关注一番,以及推荐给你的朋友,我非常喜欢和你们分享我脑海中的天马行空的想法和故事。

上面说的文生图一些技巧,或者AI写小说的技巧和手法,如果感兴趣,也可以加我(mute88,请注明来意,哈哈,先关注上面公号再加,玩笑)。


笔名“夏虫”,源自于我的另一个非技术公众号【夏虫悟冰】:以敬畏的眼光看待世界,在思考中成长自己。当然,笔者还有另一层身份,10年互联网大数据以及算法经验,创过业,也有日均数十亿分发流量的商业化广告经验,专注于搜推广以及企业数据化、智能化建设,目前在一家还算行的上市电商公司做海外业务,负责中台能力建设,目前更多关注点在国际化电商的大数据、搜推以及商品、运营、人中台等底层能力的建设。


技术主公众号当然是【数据虫巢】,之前有整个《数据与广告系列》,目前逐步趋近于收尾,关于这个系列后续更大想法是逐步整理成更为体系的书籍,这个后面再说了。后续这个号,会逐步关注于大模型与人工智能,以及国际化业务大数据、搜推以及智能化中台建设的内容。

而非技术公众号【夏虫悟冰】,也会继续更新,关注更多非技术的输出,保持对这个世界的思考,偶尔发发文青梦。欢迎大家关注,或者推荐给朋友。技术之余,依然要有“诗与远方”,一起努力和加油。

【夏虫悟冰】上之前的一些文章:

《2024:守刻缓本心驻足,持信仰之刃狂奔》-- 一年一度的总结和思考。

《互联网的落日余晖》-- 虎嗅文体,描绘当下。

《乌克兰:散装的历史与撕裂的未来》--历史文,感受那种剧烈的历史冲突感。

《爷爷与侠客行》--新文风,人物小传,时代的感叹。

现在我主理的公众号,又多了一个,主题也是明确的,就是跟AI玩一起,释放脑海里的天马行空,一起用图文来讲述你脑海中的故事,圆我们自己年少时的文青梦。


26746c3f457babccb18eb48e9220958b.png

文章都看完了,还不点个赞来个赏~

766c92152c422f8112b40b49ae5f89b1.jpeg

  • 14
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值