GIS数据组织管理
数据是GIS的“血液”,没有数据的GIS是没有生命力的。在GIS中,数据既有空间位置及图形信息,也有与之相对应的属性信息。GIS数据的特点就是数据源多、数据量大;同时系统对数据的要求也高。所以数据是GIS中最重要的部分。
1 GIS的空间数据表示
数据结构是指数据记录的编码格式及数据间的关系的描述。不同类型的数据,只有按照一定的数据结构进行组织,并将它映射到计算机存储器中去,才能进行存储、检索、处理和分析。在地理信息系统中,地理空间数据常用的数据结构有两种:栅格(Raster)数据结构和矢量( Vector)数据结构。
例如,一幅真实的地图(图3-4(a)可以分别用这两种不同的数据结构来描述。在栅格结构中,空间被有规则地分成了一个个小块,地理实体用这些小块所占据的栅格的行、列号来定义,栅格同时可以附有属性值,如图3-4(b)所示的A、B、C、D;在矢量结构中,地理实体用点、线、面来表达,其位置由二维平面直角坐标系中的坐标来定义,如图3-4(C)所示。(a——真实地物、b——栅格表示、c——矢量表示)
1.1 栅格数据
栅格数据结构由像元阵列构成,每个像元用网格单元的行和列来确定
图3-4空间实体的栅格、矢量数据结构表示
它的位置,常用于表示地质、气候、土地利用或地形等面状要素。任何面状的对象,如土地利用、土壤类型、地势起伏、环境污染等,都可以用栅格数据来表示。栅格数据的获取方法比较简单,即在专题地图上均匀地划分网格,相当于将一透明的方格纸覆盖在地图上,网格的尺寸大小依要求设定。根据单位网格交点归属法(中心点法)、单位网格面积占优法、长度占优法、重要性法等方法,直接获取相应的栅格数据。这类方法称为手工栅格数据编码法,它适用于区域范围不大或栅格单元的尺寸较大的情况。但是当区域范围较大或者栅格单元的分辨率较高时,需要采用数据类型转换方法,即由矢量数据向栅格数据作自动转换。
为了逼近原图或原始数据精度,除了采用上述的手工方法之外,还可以采用缩小单个栅格单元的方法(即增加精度),使得每个单位的栅格可以代表更为精细的地面单元。这样,在大大提高精度,更接近真实形态的同时,行、列数也将大大增加,即数据量也大幅度增加,使得数据冗余严重。为了解决这一矛盾,现已发展了一系列栅格数据压缩编码方法,如键码、游程长度编码、块码和四分数编码等。其目的就是为了用尽可能少的数据量记录尽可能多的信息,其类型又可以分为信息无损编码和信息有损编码两种。信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息;信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系统中多采用信息无损编码。
1.2 矢量数据
矢量数据结构使另一种最常见的图形数据结构,地理实体用一系列x,y坐标来确定它们的位置。矢量数据坐标空间假定为连续空间,不像栅格数据结构那样需要进行量化处理,因此,能更精确地定义位置、长度和大小。即通过记录坐标的方式,尽可能地将点、线、面等地理实体表现得精确无误。该数据结构长用于描述线装分布的地理要素,如河流、道路、等值线等。矢量数据能够准确定位,精度高,易于表达拓扑关系,存储量小,约为栅格结构存储量的1/10。但操作比较复杂,许多分析操作,如空间叠置、邻域搜索等,用矢量结构难以实现。
1.3 两种数据结构的比较、转换
(1)栅格结构和矢量结构比较
空间数据的栅格数据结构和矢量数据结构是模拟地理信息的截然不同的两种方法。它们有各自的优点和局限性。两种数据结构的比较如下:
从上述比较可以了解到栅格数据结构和矢量数据结构的适用范围。对于一个与遥感相结合的地理信息系统来说,栅格数据结构是必不可少的,因为遥感影像以像元为单位,可以直接将原始数据或经过处理的影像数据纳入栅格结构的地理信息系统。而对于地图数字化、拓扑检测、矢量绘图等,矢量数据结构又是必不可少的。较为理想的方案是采用两种数据结构并存,用计算机程序实现二种结构的高效转换。数字地图根据需要按矢量结构或栅格结构存储最大限度地减少冗余,提高数据精度,对于数据的提取和分析、输出,由程序自动根据操作的需要选取合适的结构,以获取最强的分析能力和时间效率。栅格和矢量双结构,对于提高地理信息系统的空间分辨率、数据压缩率和增强系统分析、输入输出的灵活性十分重要。但是在转换程序效率不高、硬、软件功能不太全的情况下,又要及时开展GIS工作,选用恰当的数据结构是GIS有效运行的前提之一。
据不完全统计,国内GIS项目以栅格数据作为空间数据库结构的项目约占全部项目的17%,矢量数据作为数据结构的约占53%,而空间数据库中含有两种数据结构的约占30%。时间证明,栅格结构和矢量结构在表示空间数据上可以是同样有效的。
(2)栅格数据结构和矢量数据结构的相互转换
矢量结构与栅格结构的相互转换,一直是地理信息系统的技术难题之一。这主要是由于转换程序通常占用较多的内存,涉及复杂的数值运算,而难以在实用系统特别是微机地理信息系统中被采用。近年来已发展了许多高效的转换算法,适用于不同的环境。
表3-1 栅格结构和矢量结构比较
|
栅格数据结构 |
矢量数据结构 |
优点 |
(1)数据结构简单; |
(1)表示地理数据的精度较高; |