Exploratory Social Network Analysis with Pajek(第三版)1-1

第一部分基础

社交网络分析侧重于例如人、人群、组织和国家之间的联系。这些联系结合起来形成网络,我们将学习分析这些网络。本书的第一部分介绍了社交网络的概念。我们讨论了几种类型的网络,以及我们使用计算机软件程序 Pajek 对它们进行数字和可视化分析的方法,本书通篇使用该程序。学习完第 1 章和第 2 章后,您应该了解社交网络的概念,并能够使用本书中介绍的软件创建、操作和可视化社交网络。

一、寻找社会结构

1.1 引言

社会科学关注结构人类群体、社区、组织、市场、社会或世界体系的结构。在本书中,我们将社会结构概念化为社会关系网络。社交网络分析师假设人际关系很重要,组织或国家之间的关系也很重要,因为它们传递行为、态度、信息或商品。社会网络分析提供了分析社会关系的方法;它告诉我们如何概念化社交网络以及如何分析它们。
在本书中,我们介绍了探索社交网络的最重要方法,强调视觉探索。从社交网络分析一开始,网络可视化就一直是研究人员的重要工具。本章介绍了社交网络的基本要素,并展示了如何构建和绘制社交网络。

1.2 社会计量学和社会学图

社会网络可视化的基础是由自称为社会计量学家的研究人员奠定的。他们的领袖 J. L. Moreno 创立了一门名为社会计量学的社会科学,专门研究人际关系。他们认为,社会并不是统计学家假设的个人及其特征的集合体,而是人际关系的结构。因此,个人不是社会的基本单位。社会原子由个人及其社会、经济或文化关系组成。社会原子被连接成群体,最终,社会由相互关联的群体组成。
从他们的角度来看,社会计量学家研究小群体的结构而不是整个社会的结构是可以理解的。特别是,他们调查了一个小组内的社会选择。他们问人们诸如“你会选择谁作为朋友[同事、顾问等]?”之类的问题。这种类型的数据后来被称为社会计量选择。在社会计量学中,社会选择被认为是社会关系最重要的表现形式。
在这里插入图片描述
图 2 展示了社会计量研究的一个例子。它描绘了住在纽约州一所培训学校的一个“小屋”(宿舍)中的 26 个女孩的选择。女孩们被要求选择她们最喜欢的女孩作为她们的餐桌伙伴。仅选择第一个和第二个选项。
图 2 是社会图的示例,它是群体结构的图形表示。社会图是起源于社会计量学的最重要的工具之一,它是社会网络可视化的基础。您很可能已经“阅读”并理解了该图,无需以下解释,这说明了它的视觉吸引力和概念清晰度。在这张社会图中,宿舍里的每个女孩都用一个圆圈表示。为了便于识别,女孩的名字写在圆圈旁边。每条弧线(箭头)代表一个选择。女孩向她选择的作为餐桌伴侣的女孩发出弧线。例如,Irene(在图的右下角)选择 Hilda作为她最喜欢的餐桌搭档,而Ellen是她第二选择,如同每个箭头上的数字所示。
社会图描绘了一个群体内的联系结构。这个例子不仅显示了哪些女孩很受欢迎,如她们收到的选择数所示,而且还显示了这些选择是来自受欢迎的女孩还是不受欢迎的女孩。例如,Hilda 从 Irene、Ruth、Hazel 和 Betty 那里得到了四个选择,她回应了最后两个选择。然而,这四个女孩中没有一个被其他女孩选中。因此,Hilda 位于社会图的边缘,而仅被选中两次的 Frances 则更为中心,因为她被 Adele 和 Marion 这两个“受欢迎的”女孩选中。对选择的简单计数并不能揭示这一点,而社会图则可以。
社会图已被证明是一种重要的分析工具,有助于揭示社会群体的几个结构特征。在本书中,我们充分利用了它。

1.3 探索性社会网络分析

社会计量学并不是社会科学中唯一关注社会关系的传统。在不深入历史细节的情况下,我们可能会注意到来自多个社会科学的科学家已经将网络分析应用于不同类型的社会关系和社会单元。人类学家研究人与人之间的亲属关系、友谊和送礼,而不是社会计量学的选择;社会心理学家关注情感;政治学家研究人、组织或国家之间的权力关系;经济学家研究公司之间的贸易和组织关系。在本书中,参与者一词是指参与社会关系的个人、组织或国家。可以说,社会网络分析研究了参与者之间的社会关系

  • 社交网络分析的主要目标是检测和解释参与者之间的社会关系模式

本书只关注探索性社交网络分析。这意味着我们事先没有可以测试的关于网络结构的具体假设。例如,关于餐桌伙伴网络的假设可以预测特定的相互选择率(例如,五种选择中的一种将得到回报)。这一假设必须以社会理论和先前的研究经验为基础。如果有足够的统计模型可用,则可以检验该假设。
我们在本书中没有使用假设检验(最后一章除外),因为我们不能假设在介绍性课程书中有先前的研究经验,而且因为统计模型是复杂的。因此,我们采用探索性方法,假设社交网络中关系的结构或模式(structure or pattern)对网络成员有意义,因此对研究人员也有意义。我们没有测试预先指定的结构假设,而是探索社交网络以寻找有意义的模式。
出于类似的原因,我们不关注从样本中估计网络特征。在网络分析中,估计技术甚至比统计中的估计更复杂,因为随机样本的结构很少与整个网络的结构相匹配。很容易证明这一点。例如,从餐桌伙伴网络中随机选择五个女孩,并专注于她们之间的选择。您会发现每个人的选择少于整个网络中的两个选择,原因很简单,即指向样本外女孩的选择被忽略了。即使从这个简单的方面,样本也不能代表网络。
我们分析整个网络而不是样本。但是,什么是全网?社会计量学假设社会由相互关联的群体组成,因此网络包含整个社会。对所谓的小世界问题的研究表明,熟人关系通过六到七个步骤(即通过五到六个中间人)将我们与地球上几乎每个人联系起来,因此我们的网络最终覆盖了整个世界人口,即显然网络太大而无法研究。因此,我们必须使用人为的标准来界定我们正在研究的网络。例如,我们可能只研究一个宿舍的女孩。我们不知道他们对其他宿舍餐桌伙伴的偏好。也许Hilda 是一群肉食动物中唯一的素食主义者,她更喜欢和其他宿舍的女孩一起吃饭。如果是这样,包括不同宿舍成员之间的选择将极大地改变Hilda 在网络中的地位。
因为边界标准可能会严重影响网络的结构,所以仔细考虑它是很重要的。使用实质性的论据来支持你决定将谁包含在网络中以及排除谁。
探索性社交网络分析由四个部分组成:网络的定义、网络操作、结构特征的确定和可视化检验。在后面的小节中,我们将概述这些技术。本概述旨在介绍网络分析中的基本概念,并帮助您开始使用本书中使用的软件。

1.3.1 网络定义

要分析一个网络,我们首先必须有一个网络。什么是网络?在这里和其他地方,我们使用数学的一个分支——图论来定义概念。我们在本书中介绍的大多数网络特征都源自图论。虽然这不是图论课程,但您应该仔细研究定义以了解您在应用网络分析时所做的事情。

  • 图是一系列顶点和一系列顶点对之间的线。

什么是一张图代表了一个网络的结构;它所需要的只是一系列顶点(也称为点或节点)和一组线,每条线连接两个顶点。
顶点是网络中的最小单位。在社交网络分析中,它代表一个参与者(例如,一个人,比如宿舍里的一个女孩;一个组织;或一个国家)。顶点通常由数字标识。
线是网络中两个顶点之间的链接。在社交网络分析中,它可以是任何社会关系。一条线由它的两个端点定义,端点是与该线相交的两个顶点。
是一种特殊的线,即连接顶点和自身的线。在餐桌伙伴网络中,不会出现环,因为不允许女孩选择自己作为餐桌伙伴。然而,环在某些类型的网络中是有意义的。
一条线或者有向或者无向。有向线称为(Arc),无向线称为(Edge)。社会计量选择最好用弧表示,因为一个女孩选择另一个女孩,而选择不需要互惠(例如,图 2 中的 Ella 和 Ellen)。
有向图(directed graph, or digraph)包含一个或多个弧。无向的社会关系(例如,学校项目上的合作)由一条边表示,因为两个人都平等地参与了这种关系。无向图不包含弧:它的所有线都是边。
形式上,弧是一对有序的顶点,其中第一个顶点是发送者(弧的尾部),第二个顶点是关系的接收者(弧的头部)。弧从发送者指向接收者。相反,没有方向的边由无序对表示。在这对中哪个顶点是第一个或第二个并不重要。但是,我们应该注意,一条边通常相当于一条双向弧:如果 Ella 和 Ellen 合作(无向),我们可以说 Ella 与 Ellen 合作,Ellen 与 Ella 合作(有向)。重要的是要注意这一点,我们将在后面的章节中看到。
餐桌合作伙伴网络没有多重边,因为不允许女孩提名同一个女孩作为第一和第二选择。如果没有研究人员施加的这种限制,可能会出现多重弧,并且它们实际上确实出现在其他社交网络中。

在一个图中,允许有重边,但是当我们说一个图是简单图时,我们指出它没有多重边。此外,简单无向图不包含环,而简单有向图中允许有环。记住这一点很重要。

  • 一个简单无向图既不包含多重边也不包含环。
  • 一个简单有向图不包含多重弧。

既然我们已经详细讨论了的概念,那么定义网络就很容易了。网络由图和关于图的顶点或线的附加信息组成。我们应该注意,附加信息与网络的结构无关,因为结构取决于关系(ties)的模式。
-网络由图和关于图的顶点或线的附加信息组成。

在餐桌伙伴网络中,女孩的名字代表了顶点的附加信息,这将图(graph)变成网络(network)。由于这些信息,我们可以在社会图中看到哪个顶点标识了 Ella。印在弧和边附近的数字提供了有关女孩之间联系的附加信息:1 表示第一选择,2 表示第二选择。这些被称为线值,通常表示关系的强度,它是一个数。
线也可以具有特定的特性;例如,它们可以是特定类型。餐桌合作伙伴网络中的所有线都是同一类型,表达了座位偏好。我们可以说它们表达了座位偏好关系。然而,一个网络可以包含多个关系。也许我们也知道哪些女孩在课堂项目上合作过。因为该信息涉及同一系列顶点(女孩),我们可以将此信息添加为第二组线,即作为与网络的第二个关系。这创建了一个多重关系网络,也称为多重网络( multiplex network)。
餐桌合作伙伴网络显然是一个网络,而不是一个图。它是一个有向简单网络,因为它包含弧(有向)但不包含多重弧(简单)。此外,我们知道它只包含一种关系,没有环。我们讨论的几种分析技术假设网络中不存在环和多重线。但是,我们并不总是说明网络的这些属性,而是指出它是否简单图。小心!
应用
在本书中,我们通过实践学习社交网络分析。我们使用计算机程序 Pajek(斯洛文尼亚语中的蜘蛛)来分析和绘制社交网络。本书专用网站 (http://mrvar.fdv.uni-lj.si/pajek/) 包含该软件。我们建议您在您的计算机上下载并安装 Pajek,以及本网站的所有示例数据集。按照网站上提供的指南将软件和数据集存储在计算机的硬盘上。完成后,执行我们在每章“应用程序”下讨论的命令。这将使您熟悉结构概念和 Pajek。除非另有说明,否则通过逐步遵循“应用”下的说明,您将能够生成理论部分中提供的数字和结果。有时,您计算机屏幕上的可视化效果会与书中的数字略有不同。但是,如果一般模式匹配,您就知道您走在正确的轨道上。
图论中的一些概念是 Pajek 的构建单元或数据对象。当然,网络是 Pajek 中最重要的数据对象,所以让我们先描述一下。在 Pajek 中,网络是根据图论定义的:顶点列表以及弧和边的列表,其中每条弧或边都有一个值。看一下餐桌伙伴网络数据文件的部分列表(图 3;请注意,部分顶点和弧被替换为 […])。
在这里插入图片描述
首先,数据文件指明顶点的数量。然后,每个顶点标识在单独的一行上,由序列号、文本标签(用引号 [“ ”] 括起来)和 0 到 1 之间的三个实数组成,三个实数表示在绘制网络时顶点在三维空间中的位置。我们将在第 2 章中更加关注这些坐标。现在,只要知道第一个数字指定顶点的水平位置(0 位于屏幕左侧,1 位于右侧),第二个数字给出顶点的垂直位置(0 是屏幕顶部,1 是底部)。文本标签对于识别顶点至关重要,因为顶点的序列号可能在分析过程中发生变化。
顶点列表后面是弧列表。 ∗Arcs 语句将关系编号 1(冒号后面的整数)分配给后续行中指定的弧,并且该关系被标记为“dining-table partner choice”。请注意,标签应该用双引号引起来。每行标识一条弧,通过发送顶点的序列号,后跟接收顶点的编号和弧的值来标记。就像在图论中一样,Pajek 将一条线定义为一对顶点。在图 3 中,第一条弧线代表 Ada 的选择(顶点 1)餐桌伙伴。 Louise是 Ada的第二选择; 在第二个弧表示的选择中,Cora 是Ada的第一选择。边列表类似于弧列表,除了在计算中忽略标识边的两个顶点的顺序。在这个数据文件中,边表示女孩之间的合作,这里将这个标签编码为2。边以“cooperation"作为名称。请注意,Pajek 网络文件可以包含多个∗Arcs∗Edges 语句,并且关系编号和标签不是强制性的。
有趣的是,我们可以区分结构数据或图与网络数据文件中顶点和线的附加信息。图完全由顶点序列号列表和顶点对列表定义,顶点对列表定义了它的弧和边。这部分数据在图 3 中以常规字体打印,表示网络的结构。顶点标签和坐标、关系序列号和标签、线值和标签(斜体)指定了使这些数据成为网络的顶点和线的附加属性。尽管此信息非常有用,但不是必需的:如果它们未在数据文件中指定,Pajek 将使用顶点序列号作为默认标签,并将关系序列号和线值设置为 1。此外,Pajek 可以使用其他几种数据格式(例如,矩阵格式),我们在这里不讨论。
在这里插入图片描述

通过以纯文本格式导出相关数据,可以从电子表格和数据库生成即用型网络文件。对于中型或大型网络,将数据用关系数据库进行处理有助于数据清洗和编码。
我们在 1.4 节解释了如何创建一个新的网络。让我们先看看包含餐桌伙伴选择和女生合作的宿舍网络。首先,通过双击硬盘上的 Pajek.exe 文件启动 Pajek。计算机将显示 Pajek 的主屏幕(图 4)。在此屏幕中,您可以使用文件菜单中的读取命令或单击Networks一词下带有文件夹图标的按钮来打开宿舍网络。File> Network> Read 在这两种情况下,都会出现通常的Windows 文件对话框,您可以在其中搜索并选择硬盘上的文件 Dormitory.net,前提是您已经从本书的网站下载了示例数据集。
当 Pajek 读取网络时,它会在顶部的Networks下拉菜单中显示其名称。此菜单是 Pajek 可访问的网络列表。您可以通过左键单击右侧带有三角形的按钮来打开下拉菜单。您在列表中选择的网络会在列表关闭时显示(例如,图 2 中的网络 Dormitory.net)。请注意,网络中的顶点数显示在名称旁边的括号中。所选网络是活动网络,这意味着您在网络上执行的任何操作都将使用该特定网络。例如,如果您现在使用 Draw 菜单,Pajek 会为您绘制宿舍网络。
主屏幕在两个Network下拉菜单下方显示多个下拉菜单。这些菜单中的每一个都代表 Pajek 中的一个数据对象: partition(三个下拉菜单)、vectors(两个下拉菜单)、permutations (两个下拉菜单)、clusters和hierarchies。后面的章节将使您熟悉这些数据对象。请注意,可以从“文件”菜单或使用下拉菜单左侧的四个图标打开、保存或编辑每个对象(参见第 1.4 节)。

1.3.2 操作

在社交网络分析中,修改网络通常很有用。例如,大型网络太大而无法绘制,因此我们提取了我们首先检查的网络的一个有意义的部分。与具有数千个顶点的大型网络相比,可视化对于小型(几十个顶点)到中型(几百个顶点)网络的效果要好得多。当社交网络包含不同类型的关系时,我们可能只关注一种关系;例如,我们可能只想研究宿舍网络中的餐桌伙伴选择。最后,一些分析程序要求首先将具有循环或多条线的复杂网络简化为简单的图形。
应用
应用程序网络操作是社交网络分析中非常强大的工具。在本书中,我们遇到了几种修改网络或选择子网的技术。网络操作总是会产生一个新的网络。通常,Pajek 中的许多命令会生成新的网络或其他数据对象,它们存储在下拉菜单中,而不是图形或表格输出。
操作网络的命令可从主屏幕的菜单中访问。主屏幕菜单具有清晰的逻辑。涉及一种类型数据对象的操作列在带有对象名称的菜单下;例如, Network菜单包含在一个网络上运行的所有命令,而Networks菜单列出了在两个网络上的操作。Operations 菜单中列出了需要不同类型对象的操作。当您尝试在 Pajek 中查找命令时,只需考虑要使用哪些数据对象。 Pajek 还对适用于特殊类型网络的命令进行分组。例如,所有需要多重关系网络的命令都在网络菜单的多重关系网络子菜单中可用。您将在接下来的章节中了解有关其他类型网络的更多信息。[Main] Network> Multiple Relations Network> Extract Relation(s) into separate Network(s)
以下示例重点介绍 Pajek 中菜单的使用及其在本书中的表示法。如果我们想将分析限制在用餐伙伴关系(如图 2 所示),我们必须创建一个仅包含属于第一个关系的行的新网络。因为这个操作只涉及一个网络而不涉及其他数据对象,所以我们必须在 Network 菜单中查找它。如果我们左键单击上方的Network一词,在主屏幕中,会显示一个下拉菜单。单击下拉菜单中的“Multiple Relations Network”一词。因此,我们达到了允许我们从当前活动的网络中创建一个仅包含一个关系的新网络的命令:Extract Relation(s) into separate Network(s)(参见图 5)。
在这里插入图片描述
在后续对话框中,您可以输入一个关系编号、几个连续的编号(使用破折号)或几个不连续的编号(用逗号分隔)。在我们的例子中,只需输入 1 即可获得一个仅包含餐桌伙伴关系的新网络(图 6)。来自 N1 (26) 的名为 Relation:1 [Dining-table pa] 的新网络被添加到顶部网络下拉菜单中,序列号为 2。原始网络未更改;它仍在此下拉列表中的网络列表中。
在这里插入图片描述
为了演示同时操纵两个网络,让我们找出哪些女孩通过合作和用餐伙伴选择联系在一起。换句话说,哪条线出现在两个关系上?我们已经有一个只有餐桌伙伴关系的网络,但我们还需要一个合作关系的,可以用相同的方式提取:在顶部的网络下拉菜单中选择宿舍网络,然后按照前面描述的步骤进行操作,这次提取关系号 2。如果你成功了,第三个网络会出现在这个菜单中,名为 Relation:2 [Cooperation] from N1 (26)。
在我们比较这两个网络之前,我们必须认识到一个网络包含弧(有向)而另一个包含边(无向)。我们不能直接比较弧和边,所以我们必须将弧改为边,或反之。我们建议将合作网络的边更改为双向弧,这可以通过 Network>Create New Network>Transform>Edges→Arcs 命令完成,前提是我们首先在顶部下拉菜单中选择协作网络。当执行将边变为弧的命令时,会出现一个信息框,询问是否必须建立新的网络。如果答案是“是”,我们建议这样做,就会创建一个新网络。相反,对信息框中的问题回答“否”会导致 Pajek 更改原始网络。
要比较两个网络,我们必须告诉 Pajek 我们要使用哪些网络。网络有两个下拉菜单(如果没有,请单击左侧的网络按钮),因此我们可以在每个中选择一个网络。我们建议在顶部下拉菜单中选择餐饮合作伙伴网络(对于 Pajek,这是第一个网络),并在正下方的菜单中选择边变为弧的合作网络(对于 Pajek,这是第二个网络)。现在我们可以执行 Networks 菜单的命令,包括基本的集合论运算,例如两组线的并、交、差等。我们需要Intersection,它收集出现在两个网络中的所有行:通过餐桌选择和合作连接的一对女孩。 Pajek 包含此命令的两个版本: Intersection of Multiple Relations Networks和Cross-Intersection。Intersection of Multiple Relations Networks命令仅选择出现在两个网络中、并且具有相同关系号的线。 Cross-Intersection 命令忽略关系号,这是我们在这里需要的,因为我们的两个网络具有不同的关系号。
Cross-Intersection 子菜单包含几个选项,用于组合出现在两个网络中的线的值。请注意,此集合操作将原始网络中的两条弧替换为新网络中的一条弧线,因此它必须知道如何处理原始线值。在我们的例子中,所有的合作线都有单位数值,这是没有信息的。因此,我们建议保留餐饮合作伙伴系列的数值。因为当我们创建交集时,餐饮伙伴网络在顶部的网络下拉菜单中,我们从Cross-Intersection子菜单中选择命令 First 以保留餐饮伙伴网络的线值,表示第一个和第二个餐饮伙伴的选择。你想看看结果吗?在Draw菜单中选择Network命令。这个命令在 1.3.4 节中有详细讨论,但为什么要等呢?
刚刚描述的过程是使用 Pajek 处理网络数据的特征。 Pajek 中有许多用于转换和组合网络的基本命令,通过组合这些命令可以获得大量结果。但由用户(即您)决定获得所需结果所需的命令。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值