Data Vault模型是由Dan Linstedt在20世纪90年代发明的,它面向自然界中经常发现的复杂网络。许多这些自然系统可以用复杂网络的模型来描述,这是由链接或边缘连接的节点或顶点组成的结构。例子包括人脑,它是一个神经元网络。还包括团体组织,它是人际关系网络。也包括全球经济,它是一个由市场网络组成的国家经济网络。深入来看,这些市场又由生产者和消费者的网络组成。这些网络的共同之处在于,它们有中心,如人或其他对象,这些对象之间的链接,以及描述对象上下文的信息。
在过去,科学家们认为这些网络是随机的;也就是说,中心枢纽之间的链接放置是随机的,而且大多数中心枢纽有大约数量的相同的链接。这种类型的随机网络如图4.1所示。
图 4.1 美国高速公路系统:随机网络
在一个随机的网络中,如美国的高速公路系统,大多数中心枢纽只有少数连接。这一特点是由地理、政治和经济因素所产生的许多历史决策的结果。例如,修建高速公路的成本通常限制了增加到该系统中的高速公路的数量。图4.2所示的美国航空系统也是如此,但不同的是,通过在机场之间添加新的连接来扩展网络,机场是该网络的中心枢纽。
图 4.2 美国航空公司系统:无标度的网络
网络的整体结构主要由航空公司的一致行动决定,他们试图使利润最大化。因此,航空运输网络是由网络中的对象自组织的。
我们将了解到,使用Data Vault模型构建的数据仓库与任何其他无标度网络一样容易扩展。