全文共6066字,预计学习时长12分钟
创造力是个很简单的玩意儿。意识、智慧,这些才是困难所在。David Cope

人类的艺术体验包含多种感官、联想、记忆和情感,并涉及有意识和超意识的过程。想象你正在听最喜欢的歌:每一个旋律,每一处和谐的起承转合,都与一些独特的情感有着微妙的联系,例如兴奋、平静、怀旧、嬉闹。在音乐的熏陶下,那些画面、场景和想法不断地在你脑海里跳跃,你甚至会想起一些历史和文化事件。音乐具有很强的暗示性,可以改变听众对生活体验的情感解释。电影制作人对此深谙于心,他们会利用恰到好处的配乐来操纵观众对每个场景的情绪反应。同样,绘画、雕塑、故事和诗歌也能激发情感、记忆和其他感官性的联想。可以说,如果一件艺术品无法触发多种感官的情感体验,无法激发丰富的联想,那么它一定不是优秀的艺术品。
目前尚不清楚的是,创造艺术需要何种程度的人类对艺术的体验能力。虽然AI缺乏人类的艺术感知力,但它是否也能像人类作曲家、画家一样创造艺术?越来越多的证据(尤其在绘画和音乐方面)显示,艺术创造力并不以主观体验能力为前提,而是可以由AI从人类创造的艺术和反馈中习得的。随着AI在模式和联想式学习方面能力增强,并且得到更多人类的反馈,它创造的艺术,将能够以越来越复杂的联想,引发越来越丰富的多感官体验和人类情感。也就是说,AI能创造出越来越高端的艺术,甚至有可能超越人类。
艺术创造力并不以主观体验能力为前提
科技永远在激发人类的创造力——看看史前洞穴中那些用原始工具创作的壁画,再看看几个世纪后,人们用刷子和五彩斑斓的颜料创作的绘画,还有钢琴的发明,以及被称为“第七艺术”的电影艺术的发展。人类与机器日益密切的合作有望推动艺术的下一次科技突破,创作出前所未有的艺术品。
如今的AI与艺术
人们已经将深度学习用于对人类画家进行风格模仿,并无可否认地创造出了高品质的艺术品。卷积神经网络通过对画家的风格进行编码——从较低等级的笔触,乃至空间感知和构图,抑或是画作本身,对抗生成网络(GAN)在此基础上生成逼真的绘画,例如肖像画或抽象裸体,从而实现风格迁移。第一幅被拍卖的AI绘画正是GAN(由19岁的斯坦福大学研究员Robbie Barrat开发)生成的,这幅画在佳士得拍卖行以432,500美元的价格成交。像Robbie Barrat 和Mario Klingemann这样的AI艺术家仍在进行充满创意的AI作品创作,例如输入数据、训练AI、再选出最优秀的作品。然而,由于AI艺术品与人类艺术品的区分度很小,越来越多独立的AI画家也许将要涌现。
David Cope是来自加州大学圣克鲁兹分校的作曲家和音乐教授,早在深度学习诞生之前,他就已经在AI音乐领域做出了开创性工作。1981年以来,他一直致力于通过算法提炼音乐的本质,这些算法对特定作曲家的音乐进行解构和模式识别,并与相同风格的音乐进行模式组合。他取得的第一个巨大成功是创造了“艾美”(EMI,音乐智能实验,正如Yuval Harari在《人神合一》中所讨论的),艾美借鉴了巴赫、维瓦尔第、肖邦等作曲家的艺术风格,创作出了优秀的音乐作品,并在1997年成功骗过了一个现场观众。近年来,索尼的Flow Machines系统也已创作出十分悦耳的歌曲(例如《Daddy’s Car》、《Mr Shadow》以及《A Mon Sujet》——你能听出来这些歌是AI创作的吗?)。与此同时,初创企业Aiva和Amper也在开发深度学习,并根据顾客需求进行作曲,它们可能很快就能提供个性化音乐服务。在不久的将来,即使作曲家先围绕歌词确定下了歌曲的主题和节奏发展,更具挑战性、更费力的编曲和伴奏制作或许还是得由AI胜任。当我们在试着优化人机合作时,可能会同时增强人类和AI的创造力。
AI甚至可以在没有人类经验的前提下创作诗歌。目前已经出现了能够创作巧妙俳句的机器人,其诗歌的高质量部分归功于语言本身的美感和节奏——这是AI可学习的,还有一部分归功于读者的主观感受。早在2010年,机器人创作的诗歌就已经骗过了文学杂志的审稿人。如果你认为自己可以分辨人写的诗歌和机器写的诗歌,欢迎点击此链接Bot or Not进行挑战。
除了音乐、绘画和诗歌,AI也越来越多地应用于许多其他艺术形式和创意任务中,各种AI艺术工具也正在涌现。麻省理工学院的一支创新团队正在试图证明,人机合作能够生成单凭人类无法想象的新艺术品和手工品(包括音乐、产品和产品设计、时尚、香水、巧克力松露、珠宝、鸡尾酒和戏剧)。Pamela Davis Kivelson是斯坦福大学的讲师,也是沃尔沃集团的入驻艺术家,他以硅谷的科技发展为主题,在各种表演和项目中融合了多种艺术形式,包括摄影、风格迁移的AI绘画、人像视频、甚至是AI诗歌等。她说,“AI艺术让我能够……基于NBI(“非二元性别认同”)创造出新颖的视觉语言……从字面上来看,物理学家可以用费米液体,或者量子隧道中的一组电子或一个量子比特来象征,但我希望重新定义这一形象——以挑战人类集体无意识的偏见和推论。这些隐秘的偏见一直影响着我们的行为。”
通往超级创造力之路
1965年,Stanislav Lem发表了科幻小说《Cyberiad》,书中的“建构者”Trurl试图研发写诗机器人,他意识到一位诗人的思想往往涵盖了他所在文明与文化的所有经验。为了将这些经验全部编码并输入机器,Trurl构建出了一台超级计算机,它可以模拟整个宇宙的演变,也可以模拟诗人的出生、成长以及所受的文化熏陶。这位AI诗人正如横空出世的天才,起初人们对它不屑一顾,但当最终认识到它的力量,人们痛觉失去了人生的意义并集体自杀。Trurl所遵循的实现AI创造力的路径在于复制人类的创意过程,但这有些不切实际,因为目前正在兴起的真实路径恰恰回避了对人类的复制。
假设人类距离通用AI时代还遥遥无期,那么目前的专用AI能达到何种程度的创造力?推动其发展有三条道路可循:训练、多模态、人机协作。目前人类的探索还相当有限,专用AI的提升潜力依旧很大。
持续的反馈和训练。在绘画和音乐领域,AI对人类反馈的利用还十分有限。相比之下,人类艺术家在品味艺术的过程中可以即时地(尽管是带有偏见的)进行自我批评。机器没有主观经验,无法自我指导,但它们可以通过数据训练和反馈来利用人类经验——例如通过评级或者点击“爱心”来谱曲(正如Periscope那样),抑或是画出流程草图。从许多艺术家、或者是许多艺术评论家、甚至是许多普通人那里得到反馈,可能更甚于从一位艺术家那里借鉴的主观经验。此外,这一反馈过程也会推动新的艺术风格、艺术团体和前卫作品的出现。
多模态和联想式学习。在听喜欢的歌或沉浸于某幅画时,我们所体验到的是复杂的、多模态的情感和联想,这会把我们带入一个充斥着图像、记忆、解释、分析性思想、历史文化关联以及感官体验的心灵世界,这就是艺术的最高形式。
画是看得见听不着的诗,而诗是听得见看不着的画。
列奥纳多·达芬奇
目前,大量的训练数据已然存在:电影及其音轨、歌曲及其歌词、绘画评论、音乐专辑、电影、表演。此外,众包的形式可用于对多模态关联进行大规模标签。看书时脑海里浮现出配乐,听歌时脑海里浮现出单词网络,给某段旋律配一幅合适的插画,听歌或看画时想起来一件事,欣赏艺术品时想起过去或现在的一件事或是一篇新刊登的文章……由此产生的概念网络是高度可个性化的,可以映射出具有重要历史意义的文化和代际联想——就像人类创作的艺术品一样。这一概念网络也会带来巨大的商机,比如音乐制作人可以从Netflix广受追捧的连续剧中寻找借鉴,产品设计师也可以从潮流文化中汲取灵感。
借助于大规模的训练和多模态关联的概念地图,AI还有可能准确预测人类对艺术产生的生理和心理反应,同时,AI在创造沉浸式音乐、绘画、诗歌以及多模态体验方面的能力也将远超人类。
人机合作。大规模训练和关联式学习的展开,将进一步拓展AI与人类的开创性合作。众包作曲是指作曲家先写出基本曲调,然后由AI借助网上的反馈对其进行完善和编曲。同时,习得的多模态概念地图往往可以跨越多种艺术形式和体验,例如,人可以为音乐选择插画,这些画反过来影响乐曲的谱写。此类的反馈循环可促进AI与人类在任何艺术形式上的合作——甚至是AI文学,因为AI正在快速获取与人类相媲美的写作能力。
进一步的人机协作有望促进AI能力的拓展,并最终同时提升人类和机器两者的创造力。正如Kivelson所设想的,在未来,“集体创意AI将增强全球联系,重新定义工作室的本质,挑战身份政治,并激发自由开放的新思想”。
AI艺术也许会变成最有效的社会反光镜,因为它有可能重新定义人们对身份认同的理解。
此外,正如人类艺术经常从历史和社会背景中汲取价值,AI艺术也可以将不同群体的经验、不同的艺术作品以及任何文本信息进行结合,从中捕捉人们的集体经验,重新定义人们对身份认同的理解,从而变成最有效的社会反光镜。
最后,AI还可以突破人们给创造力施加的重重枷锁。以赋格曲为例,巴赫所作的六声部赋格曲《音乐的奉献》被称为有史以来最美的曲子,但同时也十分复杂、极难驾驭。用六个以上的声部来作曲通常很困难,这是为什么?因为人能弹钢琴的只有十根手指,人的工作记忆也无法容纳四至(最多)七件互相独立的事件,画家、雕塑家和诗人也受到类似的限制。但机器是自由的,因此机器可能会将艺术的边界扩展至人类无法触及的范围。
有意识的经验vs模仿
人类在欣赏艺术时会用到神经系统,这是AI目前还不具备的。神经系统是一套复杂的情感系统,可将人类的大脑和神经内分泌系统联系在一起,通过释放激素来控制人类的感受和行为,它可以控制人类的生理反应,例如起鸡皮疙瘩、快感、心跳和呼吸的变化等,也可以借助个人经验和历史事件的记忆,将感官和概念关联相结合。许多人都认为艺术需要呈现。Kivelson认为:“舞者能用身体的特定部位感受动作。观看舞蹈时,我们能感受到舞者在表达内心的感受……如果人类集体呈现的创造性智慧有所发展,新形式的AI创造力也会出现。”
暂且不提意识这个头号难题,如果没有人类的神经系统,AI即使获得了创造力,也无法具备人类对艺术的主观体验。意识可以为创造过程提供反馈,但从本质上讲,创造力正在脱离意识。Trurl虚构的AI诗人通过吸收和学习人类的艺术作品及反馈,将有意识的经验外包给人类,它所利用的就是人类的集体意识。
此外,在不久的将来,计算机艺术家会通过创造艺术来优化预先指定的功能,例如沉浸式体验的程度,而不是为了实现其(并不存在的)表达内心世界的愿望。AI创意所产生的驱动力将与人类艺术家截然不同,因为有意识的经验驱动的创意与模仿是天差地别的。未来,AI将会学习如何引发人类某种特定的感官和情绪反应,而这一过程正如动物模仿一样,并不需要具体呈现或有意识的主观体验。
我们是否可以设计一个测试(对抗过程)来区分人类艺术和AI艺术?如果AI能够轻易通过类似图灵测试这样的测试,那就意味着无意识的AI完全可以毫无破绽地模仿人类艺术家,也即创造力完全不需要主观经验和感受能力。
创意AI将会成为一种强大的工具,正如一种新型显微镜,可用于对人类活动和沉浸式体验进行定量测量。
创意AI将会成为一种强大的工具,正如一种新型显微镜,可用于对人类活动和沉浸式体验进行定量测量。它可以回答人类难以解释的问题,例如影响人类创造力的是什么?影响人类艺术体验的是什么?艺术品是如何改变人类的生理和心理反应的?如果能够更好地理解这些,人类也就有可能在看似遥远的目标上产生突破:未来的AI+群体超级创造力机器能否具备有意识的自我经验?这一过程应该如何设计,我们又该如何在这一过程中真正理解人类意识的实质?
想要让计算机获得人类的艺术体验能力,究竟需要复制人类哪些神经过程(虽然两者的物理组成完全不同)?毕竟艺术的目标恰恰就在于获得主观的艺术体验。但目前我们对意识体验的生理过程以及能够生成有意识经验的计算机还不甚了解,从“意识是幻觉”到“一切都是艺术”,相关理论五花八门。其中,“意识是一种物质状态”、“意识源于量子波函数的坍缩”等基于物理的理论将计算机的输入/输出和人类的主观体验做出了区分,同时假设物理在计算领域具有基础性的意义。这不无道理,因为有意识的经验比单纯的输入/输出更为基础性。AI虽然不具备意识体验的神经系统,但仍可以成为艺术家,而且我们无法证明计算机可以独立于生理基础而产生意识,正如我们无法证明灵魂可以独立于物质而存在。
创意AI可能会成为通用AI的下一个里程碑,因为它能促进多模态工程和关联式学习的发展,也能推动AI与人类进行更为高效的合作。
象棋、围棋和图像识别领域的重大突破推动了专用AI的发展,与此相似,创意AI可能会成为通用AI的下一个里程碑,因为它能促进多模态工程和关联式学习的发展,也能推动更为高效的人机协作。正如Sebastian Thrun所言,“创意AI会如何演变,对此我们根本还一无所知。如果把世界上一切知识和创造力都装进一个瓶子,它迸发出的力量将超乎你的想象。”


推荐阅读专题

留言 点赞 发个朋友圈
我们一起分享AI学习与发展的干货
编译组:莫菲菲、殷睿宣
相关链接:
推荐文章阅读
长按识别二维码可添加关注
读芯君爱你