从数据模型来看,GIS基本的数据格式包括:Vector,Raster,TIN(Triangulated Irregular Network),Tabular information。
Vector数据对应的file formats有:
Coverage:: vector data format introduced with ArcInfo in 1981 (带拓扑关系)
multiple physical files(12 or so) in a folder
Shape‘file’: vector data format introduced with ArcView in 1993 (不带拓扑关系)
Geodatabase: new format introduced with ArcGIS 8.0 in 2000 (带拓扑关系)
Shapefiles are the simplest and most commonly used format and willgenerally be used in the class exercises.
Raster数据对应的file formats有:
TIN (带拓扑关系)
思考:分布式空间数据存储与并行处理需要存储空间拓扑关系。
如果单纯的用作地图背景显示,不必存储拓扑关系。但是GIS的发展已经不再是单纯的可视化阶段,而是更多面向大数据量的空间分析。
得以于表达地理现象的数据模型,栅格数据具有均匀而且连续的特质,栅格数据非常适合于空间分割与保持本地性(Locality),适合于分布式并行处理。而矢量数据则不同,在离散的模型下,难以实现不同区域简单的分割。要基于vector data进行空间分析,就必须全面存储几何数据、属性数据与拓扑关系数据。
拓扑关系本质上是在表达实体之间的存在关系,如九交模型,而分布式存储则不仅仅需要实体粒度之间的Topology,划分后的子空间之间也需要拓扑表达。这就是说,需要定义一种表达实体集合之间拓扑关系的表达模型。对,是这样。作为一个新的idea!
spatial collection topology for spatial domain decomposition.
参考文献:
GIS Data Structures
ArcGIS™: Working With Geodatabase Topology
Modelling topological spatial relations Strategies for query processing