基于网格的空间数据组织

如同许多重要的概念和技术一样,网格概念的出现是为了解决科学与工程中所面临的基本原理问题。网格概念的基本思想起源于20世纪60年代,20世纪90年代网格研究的先驱者给出了网格的具体形式。所谓网格是把整个Internet整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享(李国杰,2001)。

学术界和企业界历经10多年的研究和开发,使得网格技术开始成型,并延续至今继续发展。如图 1‑1所示,可以将网格技术的发展过程区分为几个不同的阶段。在此期间,科学界一直领导着网格技术的发展,利用这些技术来创建计算和管理数据的基础设施。并将对21世纪科学与社会的发展起到关键的推动作用。如今,网格计算已受到信息科学界专家的密切关注(陈述彭,2002),其应用与解决方案都集中在基于开放式技术的、面向服务的以及水平式的方案。

clip_image002

图 1‑1 网格技术的发展

Fig 1-1 Development of GRID

网格作为Internet的第三次浪潮,在世界各国引起了前所未有的关注和重视。美国、欧洲、日本等都启动了大型网格研究计划,并得到了产业界的支持,我国已通过863计划的高性能计算专项和软件专项等重大科研项目,在“十五”期间支持网格的研究和应用工作。目前,对网格的研究工作主要集中在:计算网格、信息网格和知识网格等三个层次(李国杰,2002)。计算网格是网格的系统层,它为应用层提供系统基础设施,通过网络连接地理上分布的各类计算机(包括机群)、数据库、各类设备和存储设备等,形成对用户相对透明的高性能计算环境,它的应用包括分布式计算、高吞吐量计算、协同工程和数据查询等许多功能。网格计算被定义为一个广域范围的“无缝集成和协同计算环境”。信息网格是要利用现有的网络基础设施、协议规范、Web和数据库技术,研制一体化的智能信息处理平台,消除信息孤岛,使得用户能方便地发布、处理和获取信息。信息网格追求的最终目标是能够做到服务点播(Service on Demand)和一步到位服务(One Click is Enough)。知识网格研制一体化的智能知识处理平台,消除知识孤岛,使得用户能方便地发布、处理和获取知识。

国际上对数据网格进行了比较深入的研究(Chervenak A et al, 2002; Stockinger H etal, 2002),提出和建立了基于文件的数据网格和基于数据库的数据网格。基于文件的数据共享方式,其代表性研究项目有欧盟的数据网格计划Data Grid。旨在访问隶属于不同机构的地域上分布的计算能力和存储工具,将为不同学科的科学实验的海量数据处理提供所需的资源,这个计划包括三个数据密集型计算应用领域:高能物理(High Energy Physics),生物和医学图像处理(Biology and Medical Image Processing)和地球观测(Earth Observation)。Data Grid是一个为e-Science提供数据解决方案的系统框架。对数据库相关的网格研究刚刚起步,代表性项目有:欧盟的数据网格Work Package 2和全球网格论坛(GGF)下属的DAIS研究组。数据网格work package2是数据网格(Data Grid)的后续工作,主要目标是为关系型DBMS提供包括数据发现、副本管理、工作流优化在内的网格应用服务接口,将其并入数据网格。SpitFires是该项目开发的一个演示系统,提供了一个DBMS的网格服务,该服务能够将网格应用客户端发送的HTTP查询请求转换成JDBC请求传递给关系型DBMS,然后将表单查询结果以XML的形式输出到客户端。DAIS研究组的全称为Data Access and Integration Service Research Group。DIAS研究将网格上的数据资源(包括文件系统和各种类型数据库)用一层统一的虚拟服务进行封装,在资源抽象成服务的基础上提供各种协同功能服务,包括发现服务、模式管理、副本管理等。

我国科技界自20世纪90年代中后期。就开始密切关注国外相关领域的动向,并及时开展跟踪研究。国防科技大学计算机学院基于元计算和网格计算技术的研究,提出了集成网络上各种信息资源、计算资源和仪器设备等的网络聚合计算环境,为用户提供有效便捷的信息服务、计算服务和决策支持服务。中科院计算所的织女星(VEGA)网格计划强调“服务网格”的思想,其不仅面向科学计算,还提供消息、邮件、内容、交易、计算等服务。织女星信息网格(Vega Information Grid, Vega-IG)是织女星网格研究计划的一个组成部分。它的目的是在数据库技术、因特网技术、网格技术、万维网服务等技术的基础上,研究信息网格的机制和体系结构,进而指导信息网格系统及应用的开发。王意洁等(2002)从应用需求出发,分析了数据网格的基本目标:命名透明性、定位透明性、协议透明性和时间的透明性,以及数据网格提供的基本服务:目录服务、注册与发布、信息发现、存储资源代理服务、身份认证服务与访问控制、调度和方法执行等,深入研究了数据网格的关键技术:元数据目录和存储资源代理,介绍了一个海量信息处理系统的设计。徐志伟等(2002)认为利用网格技术实现信息共享、管理和服务的系统通称为信息网格,与信息网格相关的研究包括数据网格和企业信息平台等;并描述了织女星信息网格的设计思想、框架和体系结构、提出了信息网格面向行为的时空模型以及构成该模型的4个正交概念和相关的推导概念;阐述了如何利用这些技术解决信息的表示、组织、获取、显示、管理和处理中遇到的关键问题。H. Zhuge等(2002)建立了一个服务网格模型,使用户能在网络上组织和准确识别服务。该服务网格模型是一个三维的服务空间(服务目录、服务等级和服务位置),其中前2个定义了服务的区域,第3个定义了存储服务的地方。服务目录是服务功能的分类,服务等级从低到高分别是系统级,中间件级,应用界面(API)级和应用级。

网格的根本特征并不是它的规模,而是资源共享,消除资源孤岛。这种开放透明地共享资源模式决定了网格与地理信息系统结合的必然性(李德仁等,2003;夏曙东,2002;孙九林,2002)。不同的学者主要是从不同的侧面来探讨网格技术在地理信息领域中的应用。

陈述彭等(2002)认为要重新认识网格地图,抓住网格计算的发展机遇,开拓地理信息的应用新领域,加强空间分析与知识发现的能力。骆剑承等(2002)采用中间件技术,提出了网格GIS的完整组织体系与结构设计,并分别根据空间数据组织、空间信息处理与分析以及空间交融等3个方面的技术实现进行了相应的论述。方金云等(2002)提出网格GIS体系结构模型,包括数据服务器、数据中间件、应用服务器、应用桥、客户端,各层都具有完整独立的应用逻辑,并通过标准接口实现相邻层次之间的数据交换。王铮等(2003)提出的网格GIS体系架构模型,包括网格GIS基础设施、安全机制、核心GIS中间件、GIS用户层次中间件、网格GIS发展环境与工具和网格GIS应用等6个层次。任建武(2003)研究并设计了基于中间件的GRID GIS框架体系结构。李德仁等(2003)针对网格对GIS提出的挑战,提出了一种既能适合网格计算环境又充分考虑到地球空间的自然特征和社会属性的差异性及社会经济发展不平衡的特点的空间信息表示方法——空间信息多级网格(Spatial Information Multi-Grid:SIMG)。

网格环境下空间数据组织与管理的研究重点不在于如何提高GIS空间数据库本身的性能或功能问题,而在于如何基于现有的GIS空间数据库,将GIS空间数据库作为基本的数据管理单元并入网格计算环境,形成空间数据网格与空间信息网格,使其能够被网格应用有序地访问和协同地调用,即如何建立GIS空间数据库资源在网格上的共享规则。

空间数据网格是利用网格技术、空间信息基础设施、空间信息网络协议规范,形成一个虚拟的空间信息管理与处理环境,将地理上分布、异构的各种设备与系统进行集成,是实现空间信息和资源共享,为用户提供一体化的空间信息服务的智能化信息平台(陈广学等,2005)。它是实现空间数据资源有机集聚与全面连通的核心与基础。空间数据网格与“分布式空间数据库”不是一个概念,空间数据网格的数据库虽然也具有地理上分布以及跨平台等特点,但它们要么具有一致的开放结构(语义、数据结构与存储格式),要么具有标准的网格接口。不像传统的分布式数据库,具有异构、异态、自封闭甚至异质等致命缺点,它们必须经过面向网格的改造与整合,建立标准的网格接口才能成为空间数据网格的结点。空间数据网格为GIS所需要的海量数据的存储、管理、共享与应用提供了方便与可能。

空间信息网格是一种汇集和共享空间信息资源,进行一体化组织与处理,具有按需服务能力的空间信息基础设施,它提供一体化的空间信息获取、处理与应用服务的基本技术框架,以及智能化的空间信息处理平台和应用环境,从而为解决信息资源的全面共享和实现空间信息的按需服务提供了技术支撑(刘经南等,2004)。空间信息网格的研究重点是如何消除信息孤岛和知识孤岛,实现信息资源和知识资源透明地共享。这种共享不是一般的文件交换与信息浏览,而是要把所有的地理信息系统连接成一个虚拟的社会组织(virtual organization),实现在动态变化环境中灵活控制的协作式信息资源共享。空间信息网格与WebGIS最大的区别是一体化,即用户看到的不是数不清的门类繁多的网站,而是单一的入口和单一系统映像。一个用户需要查询某一方面的地理信息数据,不必知道有哪些数据供应商或数据生产者,只需通过空间信息网格提供的元数据信息库进行最简单的查询,即可找到用户需要的地理信息数据。数据的查询检索对用户是透明的,只要查询请求的格式符合系统要求,经过网格计算,就可从空间信息网格中轻松获取所需要的数据。

摘自:http://blog.sina.com.cn/s/blog_5a1a57450100aglv.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值