可视化1300个故事 揭秘6种情节套路


0?wx_fmt=jpeg

伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。


 ◆ 

导言


人们天生喜欢去寻找并转述各类故事。我们所拥有的那种分享信息并定义自身存在性的能力就可以很好地解释为什么我们天生沉迷于此。


而现在,随着计算能力、语言处理和文本数字化三种技术方面的改善,以文字“大数据”来研究某种文化成为了可能。


正如美国作家库尔特·冯内古特(Kurt Vonnegut)曾经说过的那样:“这些故事都有着美丽而方便计算的格式,没有理由说我们不能把它们套进计算机的算法里去。”


0?wx_fmt=png图1 J.K.罗琳所著的《哈利·波特与死亡圣器》的情感线

(注:整个系列共七部书可以被定义为一个复杂的“杀死怪物”情节。数据分析:Hedonometer / Andy Reagan / Kirsch)



伯灵顿佛蒙特大学故事计算实验室的安德鲁·里根(Andrew Reagan)和他的研究团队用情绪分析绘制了约1300多个故事的情感线,然后使用数据挖掘技术来揭示最常见的情感线是什么样子。研究中,安德鲁·里根和他的研究团队发现,形成复杂叙事的基石仅仅源自于六种核心故事线。


这项研究令人着迷的奇妙之处就在于首次提出了基本故事线的确存在的实验性依据,并由此解开了讲故事之所以能够吸引人们的本质特征。


 ◆ 

实验展示

 

科学家收集了1327本书作为样本,这些样本书绝大多数采用了收录进古登堡计划中的元数据来虚构故事(P.S.古登堡计划是于1971年发起的世界上第一个数字图书馆。其中所有书籍的输入都是由志愿者完成的)。为了生成样本书的情感线,研究者将文本分为了一个个10000的小块,并分析每个小块里的所表达的感情。(如图2所示)

   

0?wx_fmt=png

图2


研究中所有样本书的故事线和相应的数据可视化如图3所示。

 

六种基本故事线形态分别为:


  1. “白手起家”(故事线主要特征形态为:上升)

  2. “悲剧”或“凤凰变麻雀”(故事线主要特征形态为:下降)

  3. “陷入困境的人”(故事线主要特征形态为:先降后升)

  4. “伊卡洛斯” (故事线主要特征形态为:先升后降)(P.S.希腊神话中代达罗斯的儿子。在用蜡和羽毛做的翅膀逃离克里特岛时,因飞得太高,双翼上的蜡遭太阳融化跌落水中丧生,被埋葬在一个海岛上。)

  5. “灰姑娘”(故事线主要特征形态为:先升后降再升)

  6. “俄狄浦斯”(故事线主要特征形态为:先降后升再降)(P.S. 俄狄浦斯是外国文学史上典型的命运悲剧人物。他在不知情的情况下,杀死了自己的父亲并娶了自己的母亲。)


0?wx_fmt=jpeg
图3 六种基本故事线的形态展示

(点击查看高清图片)

(注:从左至右从上到下依次为:“白手起家”、“陷入困境的人”、“灰姑娘”、“悲剧”、“俄狄浦斯”、“伊卡洛斯”。数据分析:Reagan et. al/ University of Vermont)


 ◆ 

结论

 

当研究团队确定了六种基本的情感故事线之后,又进一步观察了情感线与其故事下载量之间的关系,并据此探索最受欢迎的情感故事线类型。最终的研究结果显示,最受欢迎的故事往往遵循“伊卡洛斯”和“俄狄浦斯”两种类型的情感故事线。

 

另外,把众多感情线揉到一起的那些更复杂的故事同样受到追捧。事实上,研究结果显示,最受欢迎的故事往往是连续两次出现“陷入困境的人”的,还有“灰姑娘”紧接一个“悲剧”的故事。

原文发布时间为:2016-10-28


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值