参赛单元:传统GIS数据处理
作者:曹文涛
单位:武汉市测绘研究院
一,概述
随着经济社会的不断发展进步,尤其是互联网地图等新型地理空间数据的出现与迅猛发展,各行业对于矢量地理空间数据的现势性和准确性要求越来越高,因此,针对不同现势性、不同精度、不同来源的矢量数据融合技术进行研究具有十分重要的意义。这有利于降低地理空间数据的生产成本,加快其更新速度,提高其质量、精度和现势性,从而促进不同空间数据部门间的合作,推动空间数据的集成与共享,为城市社会发展和规划决策提供必要的技术和数据支持。
堪称数据处理界“瑞士军刀”的FME,对于矢量数据融合这个研究热点来说,会有怎样的表现呢,这盘棋能否下得精彩呢?本文就利用FME对矢量数据融合进行一些探讨。
二、矢量数据融合
2.1融合的条件与内容
首先,当待融合的数据源具有一些特点时,即前提条件,进行数据融合才有一定的意义,才能提高原始数据应用的深度、广度和增值程度。这些条件主要包括以下几个方面:
(1)在空间方面,待融合的数据源具有重叠区域;
(2)在尺度方面,待融合的数据源在尺度方面是相同或相近的;
(3)在时间方面,待融合的数据源是处于同一时期或者相近的时期;
(4)在数据特点方面,待融合的数据源应在精度、属性、现势性、详细程度、数据完整性等方面有所侧重。
当不同数据源符合以上若干条件时,才具备融合的价值和意义。
其次,由于各种矢量数据生产软件的功能、特点和优势等不同,造成矢量数据的格式、组织结构、表达方式等有较大的差异,因此在进行数据融合时,需要考虑空间数据模型、几何图形、实体属性、数据质量等方面的融合,在融合的过程中,一般分为数据预处理、同名实体匹配、几何图形调整和属性信息融合等内容,将在以下章节中进行具体的阐述。
2.2 数据预处理
数据预处理是指对不同的数据源进行规范化处理,使得它们具有相同的格式、坐标系统和地图投影等。在FME 中,数据预处理中的格式统一问题可以忽略,它本来就能兼容读取各种不同格式的矢量数据,而空间位置的统一分为两种情况,如果待融合数据源的坐标系统和投影类型已集成在FME的坐标系统定义文件中,则可直接调用Reprojector转换器;如果未集成,则可通过向LocalCoordSysDefs.fme和MyCoordSysDefs.fme文件中添加坐标系的相关定义描述,然后再调用Reprojector转换器进行坐标转换即可,如图1所示,考虑到篇幅问题,其他预处理内容这里不再描述。
图1 FME中涉及坐标转换的配置文件与转换器
2.3 同名实体匹配
去年参加博客大赛时,写到过多尺度线和面要素的一致性检测内容,其中就涉及到同名实体的匹配,主要从空间位置、几何形状、拓扑关系和语义属性等四个方面进行考虑。设待匹配的要素A和B,二者的要素相似度ObjSim(A,B) 是将空间相似度SA,B 、几何相似度GA,B 、拓扑相似度TA,B 和语义相似度semA,B 等结合在一起,综合评价它们之间的整体相似情况,其值的取值区间为[0,1],ωS 、ωG 、ωT 和ωsem 分别代表空间、几何、拓扑相似度和语义相似度在评价要素相似度时的权重值,须满足ωS+ωG+ωT+ωsem=1 ,要素相似度ObjSim(A,B) 的计算公式如式(1)所示:
ObjSimA,B=SA,B*ωS+GA,B*ωG+TA,B*ωT+semA,B*ωsem (1)
从A和B的候选集中选取要素相似度最大的匹配组合