《大卫科波菲尔》社会网络分析

1.简介

1.1数据集介绍

Newman教授的个人数据网站
网址:http://www-personal.umich.edu/~mejn/netdata/
从这个网址上下载adjNoun.gml文件。(如有侵权联系删除)

1.2社会网络分析简介

文学作品网络分析是一种研究文学作品中角色、情节、主题等要素之间关系的方法。它通过分析作品中的节点和连接来揭示出文学作品中的模式和动态。在文学作品网络分析中,节点代表作品中的角色、事件、地点等要素,而边表示它们之间的关系,比如互动、关联、冲突等。通过分析节点之间的连接强度和类型,我们可以研究角色之间的关系和互动,揭示出主要角色、关键角色和角色之间的权力结构。

此外,文学作品网络分析还可以帮助我们揭示作品的情节结构和主题。通过分析情节节点之间的连接,我们可以了解情节之间的联系和发展,以及主题在作品中的呈现方式。作品风格和风格转变也是文学作品网络分析的研究方向之一。通过分析文学作品中的词汇、句法等特征节点之间的连接,我们可以揭示出作品的风格特点和转变趋势。这种分析有助于我们理解作家的写作风格,从而更好地欣赏和解读作品。

文学作品网络分析还可以研究不同作品之间的关联和流派发展。通过分析作品的引用关系和影响力传播路径,我们可以了解作品在文学领域的影响力和地位。这对于了解文学作品的影响力和意义具有重要意义。

然而,文学作品网络分析也面临一些挑战。首先,数据获取和处理可能是一个挑战,特别是对于传统文学作品来说,数据的可获得性可能受到限制。其次,解释性和主观性是文学作品网络分析中的一个问题。文学作品具有多重解读的特点,因此对于网络分析的结果的解释需要结合文学理论和背景知识进行深入分析。

未来的研究可以继续探索文学作品网络分析的方法和技术,以应对这些挑战,并将其与其他学科方法相结合,如情感分析、机器学习等,以获得更全面和深入的洞察。通过深化对文学作品网络的研究,我们可以更好地理解文学作品的结构、关系和意义,从而丰富我们对文学的认识和欣赏。通过分析作品中的节点和连接,我们能够揭示作品的内在特征和动态。这种研究将有助于我们更深入地理解文学作品的内涵和意义,拓宽我们的文学视野,并为文学研究提供新的方法和途径。

尽管文学作品网络分析面临一些挑战,但它作为一种独特的研究方法,已经为我们揭示了文学作品背后的复杂关系和深刻内涵。通过深入研究文学作品的网络结构,我们能够更好地理解作品中的角色、情节和主题,洞察作品的结构和风格变化,并把握作品的影响力和地位。未来的研究将进一步推动文学作品网络分析的发展,拓宽我们对文学作品的认识和解读,丰富我们的文学体验。

1.3《大卫·科波菲尔》介绍

大卫·科波菲尔》是英国小说家查尔斯·狄更斯创作的长篇小说,被称为他“心中最宠爱的孩子”,于1849年至1850年间分二十个部分逐月发表。这本书从字里行间表述出的真挚情感描述了主人公悲惨的童年及以后经不懈努力而成功的故事。

书中的大卫童年可谓悲惨至极,充满黑暗。先是父亲病亡,后父残酷的殴打自我,以及被送到寄宿学校里,也受到校长的威胁,可是在学校的日子里还不算是全充满暴力的。他至少认识了几个朋友,但朋友也有好有坏,在表面好却内心坏的朋友面前,大卫竟没有丝毫察觉,以至于之后给他的家人带来不幸。经一系列的磨难之后,大卫长大成年,通过自我的不懈努力,大卫最终改变了自我的命运,从而组成了一个和睦的家庭并获得了事业的成功。

这本书给我的启发颇深。有人说:人自呱呱坠地时,上帝就已经为他规划好了不可改变的漫漫长途。但这本书却驳斥了这一说法。大卫是悲伤的,这不可否认。但他之后的努利却让他改变命运,走出阴影。我们应该佩服他陷入绝境还能坚持下来的勇气和毅力。

大卫·科波菲尔尚未出世时,他的父亲就去世了,他在母亲及女仆的照顾下长大。不久,母亲改嫁,后附摩德斯东凶狠贪婪,他把大卫看作累赘,婚前就把大卫送到了他乳母的兄弟辟果提先生家里。辟果提是个正直善良的渔民,住在雅茅斯海边一座用破船改成的小屋里,与收养的一对孤儿艾米莉和汉姆相依为命,大卫和他们一起过着清苦和睦的生活。

出于对母亲的思念,大卫又回到了后父家。然而后父不仅常常责打他,甚至剥夺了母亲对他关怀和爱抚的权利。母亲去世后,后父立即把不足10岁的大卫送去当洗刷酒瓶的童工,大卫从此过起了不能温饱的生活。他历尽艰辛,最后找到了姨婆贝西小姐。

贝西小姐生性怪癖,但心地善良。她收留了大卫,让他上学深造。大卫求学期间,寄宿在姨婆的律师威克菲尔家里,与他的女儿艾妮斯结下了深厚的情谊。但大卫对威克菲尔雇用的一个名叫希普的书记极为反感,讨厌他那种阳奉阴违、曲意逢迎的丑态。

大卫中学毕业后外出旅行,邂逅了童年时代的同学斯蒂福兹。两人一起来到雅茅斯,拜访辟果提一家。已经和汉姆订婚的艾米莉经受不住阔少爷斯蒂福兹的引诱,竟在结婚前夕与他私奔国外。辟果提先生痛苦万分,发誓要找回艾米莉。

大卫回到伦敦,在斯本罗律师事务所任见习生。他从艾妮斯口中获悉,威克菲尔律师落入诡计多端的希普所设计的陷阱,正处在走投无路的境地,这使大卫非常愤慨。此时的大卫爱上了斯本罗律师的女儿朵拉,但两人婚后的生活并不理想。朵拉是个容貌美丽,但头脑简单的“洋娃娃”。贝西姨婆也濒临破产。这时,大卫再次遇见他当童工时的房东米考伯,米考伯现在是希普的秘书,经过激烈的思想斗争,他最终揭露了希普陷害威克菲尔并导致贝西小姐破产的种种阴谋。在事实面前,希普只好伏罪。
与此同时,辟果提和汉姆经过多方奔波,终于找到了被斯蒂福兹抛弃后,沦落在伦敦的艾米莉,并决定将他带回澳大利亚,开始新的生活。然而就在启程前夕,海上突然风狂雨骤,一艘来自西班牙的客轮在雅茅斯遇险沉没,只剩下一个濒死的旅客紧紧地抓着桅杆。汉姆见状不顾自身危险,下海就他,不幸被巨浪吞没。当人们捞起他的尸体时,船上那名旅客的尸体也漂到了岸边,原来竟是诱拐艾米莉的斯蒂福兹。艾米莉为汉姆的行动深深的打动了,回到澳大利亚后,她中日在劳动中寻找安宁,并且终身未嫁。

大卫终于成了一名作家,朵拉却患上了重病,在辟果提前往澳大利亚前夕便离开了人世。大卫满怀悲痛地出国旅行散心,期间,艾妮斯始终与他保持联系。当他三年后返回英国时,才发现艾妮斯一直爱着他。两人最终走到了一起,与姨婆贝西、辟果提愉快地生活着。

2.描述性统计

本文的数据集是《大卫 科波菲尔》中的相邻形容词-名词网络。网络中的节点表示小说中出现的常用形容词与名词,边表示相邻形容词和名词一起出现在小说中。

网络规模:网络中共有112个节点,425条边。节点的数据概览如图1所示。‘id’列为小说中常用词(节点)的编号,‘Label’列为常用词,‘value’列表示词的词性,0为形容词,1为名词:

在这里插入图片描述
连边表示该词语与另一词性词语在小说中相邻出现,在文学作品中,形容词往往可以体现人物的遭遇,也可以通过一些名词性的事物来体现人物特点和环境特征。该数据集中认为所有的词权重相同,都为1。 将这些节点和边的情况绘制成图:
在这里插入图片描述
为了更好的将词之间的连接关系用网络图的形式展示出来,我们给每个节点添加上具体的标签,由于节点的权重都是1,所以连边的宽度保持一样,具体的展示效果:
在这里插入图片描述

在整部小说的词网络中,前五个度最高的词都是形容词,这五个常用词及其度分别为little:49;old:33;other:28;good:28;same:21。在这五个词中,‘little’是一个带一重极强否定之意的词,而‘good’是一个具有积极或正面的意义的词,所以以这两个词为例,分析与它们关系最为密切的几个节点(与它们相邻的常用词)的练习。我们突出显示这些重要常用词以及与它密切相关的节点和连边:

在这里插入图片描述

3.网络概述

4.社区发现

词网络分析可以将词之间的关联关系表示为网络结构,通过社区发现,我们可以将网络中紧密相关的单词划分为社区,从而揭示语义主题。社区内的词往往具有相似的含义、相似性或在语义上相关的概念。这有助于我们理解文本语义结构、主题关联以及单词之间的语义关系。基于此,本文将数据集分成了6个社区,模块化系数为0.282,社区类别及节点的个数:

分类后的社区网络:

节点的度越大,可以认为节点在该社区中越重要;节点的介数中心性越高,表示节点可能会连接其他社区,起到了连接网络中不同社区的作用。我们分别从节点度和介数中心性的角度出发,观察每个社区的度和介数中心性:

社区4包含度数和介数中心性最大的节点:“little”;社区2包含度数和介数中心性最小的节点:“room”。
接下来,回到数据集本身,在每个社区里观察其包含的常用词,来进一步推测该社区描述的相关内容,同时也可以从这些词中去推测小说的情感极性:

此外,对文本数据集的内容进行分析,得出以下结论:

 共有112个词,其中有54个名词,58个形容词,它们数量相当。
 所有词中度最大的前5个词:

 观察度最大的前五个词连接的名词有以下特点:

以little和good为例:

little连接了两种名词,一方面,它连接了Eye/face/man/child/door/thing等表示具体事物的名词,另一方面,它连接了Light/hope/love/friend等具有感情色彩的名词,而little本身是一个极具否定情感色彩的形容词,意为“没有,不”等。这从两方面反映了小说中人物的不美好的经历。

good也连接了两种名词,一方面,它连接了word/night/thing/person/place等表示具体事物的名词,另一方面,它连接了hope/time/friend等具有感情色彩的名词,而good本身是一个极具正面情感的形容词,意为“好的,美好的”等。这从两方面反应了小说中人物的美好的经历。

 寻找有感情色彩的名词、形容词,观察它们的连接词集。可从下图看出,形容词与形容词、形容词与名词之间的连接均有双面色彩性,也从侧面反映了小说中人物身上的复杂特征和故事本身的丰富性。

最后,利用python的第三方库Textblob计算形容词的情感得分,并将其分成正向词、负向词和中立词三类,分别计算这三类词的数量:

可以看出,负向词的数量众多,可以体现出小说中人物的经历或是故事情节是更偏向于负面描述的。回到小说本身,主人公大卫从幼年到中年,经历了双亲的失去,友情的背叛,爱情的曲折……,他经历过一番生活的毒打,最后获得了属于自己的事业和爱情,获得了自己的圆满人生。这警示我们,做人要善良、待人诚恳,要勤奋好学,除此之外还要有自强不息的勇气、百折不回的毅力和积极进取的精神,在逆境中满怀信心,在顺境中加倍努力,这样的人生才会是幸福的,圆满的,精彩的人生。

5.好句摘抄

 决不要把今日可办之事拖至明日。
 在这个残酷的世界中,爱情必须受苦,过去是这样,将来也要这样。
 无论做什么事,请记住:千万不要小气,千万不要虚假,千万不要残酷。

6.总结和不足

文本网络分析作为一种研究方法,有助于揭示文本数据中的内在结构和关系。通过将文本转化为网络图,我们可以观察和分析文本元素之间的连接和交互。这种视觉化呈现方式使得复杂的文本数据更易于理解和解释,并有助于发现文本中的模式、主题和关键概念。同时,文本网络分析提供了一种全新的角度来研究文本。传统的文本分析方法主要侧重于词汇和句法的分析,而文本网络分析则注重于文本元素之间的关系。通过分析节点和边的属性及连接模式,可以深入挖掘文本的意义、结构和主题,以及其中的隐含信息和潜在模式。然而,这需要载数据获取和处理上下很大的功夫。另外,文本分析的结果可能受到主观性和解释性的影响,并不能完全捕捉到文本的语义和情感信息,因为它主要关注节点和边的关系而非其具体含义。未来可以通过和情感分析等技术的结合,提升文本网络分析的准确性和效果。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

弓早早o_O

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值