GIS 3.地理空间数据的组成与特征

3.1 地理空间数据的基本结构

1.地理空间数据定义与特征

空间对象:GIS处理的客体,是现实世界中客观存在的实体或现象。可以抽象成点、线、面、体等多种数据类型。

● 点对象的表达:相对集中于一个较小范围,且按比例尺缩小后仅能呈点状分布的实体或现象。eg.温度监测站的分布
● 线对象的表达:呈线状或带状分布的实体或动态现象。eg.物流配送线路
● 面对象的表达:分布于较广大范围,且按比例尺缩小后仍能明确显示其轮廓的实体或现象。eg.土地利用类型图
● 体对象的表达:通常用来表示人工或自然的具有长、宽、高的三维目标。eg.三维场景
在GIS中,地理数据是表示地理位置、分布特点的自然现象和社会现象的诸要素文件。它包括自然地理数据和社会经济数据。

地理空间数据的特征:

  1. 空间特征:指空间物体的几何特征以及拓扑关系。
  2. 属性特征:与空间现象的属性信息相关联。
  3. 时间特征:地理空间数据是动态的信息。

2.地理空间数据的分类

根据数据来源划分为四类

3.地理空间数据结构与组织

图形数据

● 概念:把构成地图要素的点、线、面以点的坐标对(×,y)形式记录下来,形成有规律的数据集合体。
● 来源:纸质地图数字化,空间分析结果,测量获得,图像数据转换获得。
● 表达:
点以单一的坐标对来表示。(“代码”,1,x,Y,)
线以多个坐标对来表示。(“代码”,n,x1,Y1,x2,Y2…xn,Yn)
面以多个坐标对来表示,且最后一个坐标对与第一个坐标对相重合。(“代码”,n,x1,Y1,x2,Y2…xn-1,Yn-1)
● 组织:

● 图形数据的比例尺:反映了制图区域和地图的比例关系。地图上某线段的长度与实地相应线段的水平长度之比,称为地图比例尺。
图上1cm=实地1公里,即地图比例尺为1:100000。
● 图形数据的拓扑结构:指基本要素点、线、面和体之间具有邻接、关联和包含的拓扑关系,与长度、面积无关。
欧几里德平面上实体对象都具有着拓扑和非拓扑属性。
拓扑属性:

  1. 一个点在一个弧段的端点。
  2. 一个弧段是一个简单弧段。(自身不相交)
  3. 一个点在一个区域的边界上。
  4. 一个面的连接性。(任意两点有路径)
    非拓扑属性:●两点之间的距离●弧段的长度●一个区域的周长、面积
    拓扑邻接:存在于空间图形同类要素之间的拓扑关系,如节点邻接关系,多边形邻接关系。eg.湖南与湖北
    拓扑关联:存在于空间图形中不同类要素之间的拓扑关系,如多边形与弧段、弧段与节点之间的关联关系。eg.道路与建筑
    拓扑包含:存在于空间图形中同类但不同级的基本要素之间的拓扑关系。eg.省与市

图像数据

● 概念:图像数据的最小单元为象元或像素,像元的数值可用于描述客观世界中存在的现象。
● 实质:像元的阵列。每个像元由行列号确定其位置,且具有实体属性的编码值。
在这里插入图片描述

图像栅格数据是地表一定面积内数据的近似、离散化的表示。
空间分辨率:像素所代表的的地面范围的大小,即扫描仪的瞬时视场,或地面物体能分辨的最小单元。

距离d1<分辨率,不可分辨出两个地物。距离d2>分辨率,可以分辨出两个地物。
● 表达
在这里插入图片描述

● 组织形式
1.面向栅格单元:以不同层中对应于同一象元位置上的各个属性值表示为一个数组。
2.面向地理实体:以多边形为单位,记录属性值及组成多边形的各个像元坐标。
3.以“层”方式存储:以层为基础,每层以像元为序,记录其坐标和属性值。
● 方向表达
在这里插入图片描述

水文分析应用
在这里插入图片描述

3.2 矢量数据的结构特征

1.矢量数据的概念

矢量数据是指通过记录地理实体坐标的方式精确地表示点、线、面等实体的空间位置和形状。

2.矢量数据的编码

数据编码:把需要加工处理的信息,根据一定的数据结构和目标的定性特征,用特定的代码或编码字符表示,以便于计算机识别和管理。eg.矩阵二元映射为数组

编码分类

● 坐标序列法:任何点、线、面实体都可以用某一坐标体系中的坐标点坐标(x,y )来表示。
优点:文件结构简单。易于实现以多边形为单位的运算和显示。
缺点:公共边重复存储,造成冗余和匹配误差。缺少邻域关系信息。不能解决多边形嵌套问题。

● 树状索引编码法:采用树状索引以减少数据冗余并间接表示邻域信息。
优点:消除了相邻多边形边界的数据冗余和不一致。
缺点:获取邻域信息和岛状信息较麻烦,需要查找所有多边形索引文件。

● 拓扑结构编码法:解决多边形嵌套和邻域关系。输入数据的同时输入拓扑连接关系。从一系列相互关联的链建立拓扑结构。

双重独立地图编码系统:DIME(Dual Independent )数据文件的基本元素是由始末点定义的弧段,复杂的曲线可由多条弧段组成。每条弧段有两个指向结点的指针,和两边多边形的编码。查找组织多边形的各条边界线的效率较低。

3.矢量数据的压缩

● 概念:从所取得的矢量数据集合中抽出一个子集作为一个新的信息源,在规定的精度范围内最好地逼近原集合,而又取得尽可能大的压缩比。
● 原则:最好地逼近原集合(形状、密度、空间关系…);取得尽可能大的压缩比。
压缩比:表示信息载负量减少的程度

压缩方法

● 间隔取点法:每隔n个点取一点,或每隔一规定的距离取一点,但首末点一定要保留。
● 间隔取点法-按距离取点:没有考虑相邻点对之间的精确关系,可能会遗漏拐点和极值点。
在这里插入图片描述

● 垂距法:在给定的曲线上每次顺序取三个点,计算中间点与其它两点连线的垂距d,并与阈值L比较。若大于阈值,则保留该节点,否则删除。(考虑点间距离变化)
在这里插入图片描述

● 偏角法:计算连接第一点和第二点,与连接第一点和第三点的矢量间的夹角。如果这个角度超过了预定的角度限差,就保留中间点,否则删除。(考虑点间角度变化)
在这里插入图片描述

● 光栏法:由点和限差圆盘来定义一个扇形,根据曲线上点是否在扇形区域内来确定取舍

1)以P1为起点,连接P1P2,过P2做P1P2的垂线a1a2,使得a1P2 = a2P2 = L/2,定义扇形区域a1P1a2。

2)判断P3是否在扇形内。若在,舍去P2,连接P1P3,过P3作P1P3的垂线b1b2,使b1P3 = b2P3 = L/2。若b1或b2落在扇形a1P1a2外,则用b1b2与扇形的交点c1或c2代替。定义扇形b1P1c2
3)判断下一个节点是否在扇形内。是,则重复②,直到下一节点在最新定义的扇形外。

4)当发现在扇形外的节点,如图P4,此时保留P3,并以P3为新的起点,重复1—3的步骤。直到整个点列处理完,保留的节点顺序构成新的点列。
● 道格拉斯-普克法:对给定曲线的首末点虚连一条直线,求中间所有点与直线间的距离,并找出最大距离dmax,用dmax与限差L比较:
大则保留对应点,以该点为界将曲线分为两段,对每一段重复使用该方法。小则舍去所有中间点。(整体出发,递归选择曲线弯曲强(转角大)的地方)

优点:选择的点是原始曲线上的点,保证了精度;与原曲线相比,整体位移最小;.与手工综合中选择的关键点基本一致。

4.矢量数据的变换

二维几何图形的变换
点的变换可以由矩阵算子来实现,含有点的坐标矩阵(x,y)和一个一般的2*2的变换矩阵(称之为矩阵算子)相乘的结果是:

平移变换translate:x’( i)=x(i)Tri(xp,yp)。Tri(xp,yp)是平移变换算子,其元素排列形式为∶

比例变换scale:x '( i) =x(i)Scl(s 1 , S2)。Scl(S1,S2)为比例变换算子,其元素排列形式为:

S1=S2≠1时,为相似变换
S1=1, S2≠1时,为y方向的变换
S1≠ 1, S2=1时,为x方向的变换
当S1≠ S2≠1时,为x和y方向都变比例,且不等。
旋转变换rotation:x '( i ) =x(i)Rot(θ)。θ为旋角,它从x轴正向起算,逆时针为正,顺时针为负,Rot(θ)为旋转变换因子,其矩阵元素排列为∶

错移变换:x '(i) =x(i)T ( m , n )。m和n方向错移,T( m, n)为错移变换算子,其矩阵元素排列形式为∶

当n=0时,向x方向错移(沿着x的边改变角度)。当m=0时,向y方向错移。

Trl(2,1),Rot(30° ) , Scl ( 2,2 ),scl ( 2, 1 )
Scl ( 1, 2 ) ,Scl ( 0.5,0.5 ),T(0.5,0),T(0,0.5)
Rot ( -θ )是Rot ( θ )的逆运算,即Rot ( - θ ) ·Rot(θ)=1
Rot -1(θ)=Rot(- θ)。Trl -1(xp, yp)=Trl(-xp , -yp)。Scl -1(S1,S2)=Scl(1/S1,1/S2)

正交矩阵:

3.3 栅格数据的结构特征

1.栅格数据的概念

● 概念:把空间分割成统一的尺寸与形状(栅格或格子)的一种空间填充数据结构,整个区域由栅格单元(象元或像素)组成。
● 分层:每个层只能描述一种信息。
● 获取:1.中心归属法,每个栅格单元的值以网格中心点对应的面域属性值来确定。(人口密度分布)
2.面积归属法:值以在该网格单元中占据最大面积的属性值来确定。(城市绿地)
3.长度归属法:值以网格中线的大部分长度所对应的面域的属性值来确定。(地质断裂带)

栅格单元位置和属性值:每个栅格单元都有自己的位置和属性值。
分辨率为50m,X所处的位置为(4,3),左上角坐标为(1000,1000 ),x’=1000-504=800,y’=1000+503=1150。

2.栅格数据的压缩编码

长度编码法:从左向右,从上至下扫描栅格数据,记录属性值及相同的栅格数目。
改变扫描顺序法:迂回式的读取数据方法,省去每次跳回每行开始处的时间,节省扫描时间。
链式编码/边界链码法:多边形的边界可表示为由某一原点开始并按某些基本方向确定的单位矢量链。缺点:难以实现叠加运算。局部修改将改变整体结构,效率低。相邻边界重复存储。
游程长度编码:按行的顺序存储多边形内的各个像元的列号,即在某行上从左到右存储该多边形的始末像元列号。

特点:在许多相邻像元属性值相同的基础上,压缩效率更高。进行网格加密时,数据量没有明显增加。易于检索、叠加、合并等操作。压缩和解压处理工作都有所增加。
块式编码:将游程长度编码扩大到二维的情况,把多边形范围划分成由像元组成的正方形,然后对各个正方形进行编码。

特点:所能包含的正方形越大,边界越简单,编码的效果越好。在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。对不适应的运算方式,必须再转换成简单数据形式才能顺利进行。
四叉树编码:将2n×2n像元阵列的区域,逐步分解为包含单一类型的方形区域,最小的方形区域为一个像元。(广泛使用)

优点:容易而有效地计算多边形的数量特征。阵列各部分的分辨率是可变的。与简单栅格编码的相互转换较容易。多边形中嵌套不同类型小多边形的表示较方便。
缺点:转换的不确定性,用同一形状和大小的多边形可能得出多种不同的四叉树结构。

3.栅格数据的运算

二值图像:每个像素只有两个可能值(0,1),灰度值没有中间过渡的数字图像。
优点:占用空间少。容易识别图像的结构特征。
缺点:只能描述轮廓,不能描述图像内部细节。
布尔逻辑运算是一种基本运算

宏运算
扩张:描述地理事物的扩张,如城市扩张,污染物扩散。

侵蚀:描述地理事物分布或影响范围的缩小,如农田被侵占。

加粗:

减细运算的原理:加粗“0”象元,但需要添加限制条件,以避免线划断裂或象元消失。
填充:带有边界条件的逐步加粗法

栅格数据重采样:当栅格单元分辨率不一致的情况下,为实现入库或叠加处理,需要使用重采样技术(Resampling),把不同尺寸的栅格转化为同一种尺寸的栅格。
通常把尺寸较小的栅格转化为较大的尺寸。

3.4 矢量和栅格数据格式的转换

矢量与栅格数据比较
矢量数据 栅格数据
优点 数据结构更加严密,
便于拓扑操作,
图形输出美观。 数据结构简单,叠加操作更易实现、更有效。能有效表达空间可变性。便于进行图像的有效增强。

缺点 数据结构复杂,叠加操作不方便,表达空间变化性能力差,难以实现增强处理。 数据量大,需要压缩。难以表达拓扑关系。图像放大输出不美观,有锯齿。

1.矢量转栅格

点的转换
设点的矢量坐标为(x,y ),转换后栅格单元的行列值分别为Ⅰ和J,则有I=1+INT 〔( y max-y )/dy ] J=1+INT 〔(x- Xmin )/dx 〕

线的转换
某一线段两端点的坐标为(×1,y1 ) ,( x2,y2 ) ,且y2> y1。
线段两端点所在栅格的行列号分别为I,J和I2,J2。
点(xi,yi)为直线段经过的中间栅格的水平中心线与直线段交点的坐标。

多边形的转换
● 扫描算法:沿栅格阵列的行的方向扫描,在每两次遇到多边形边界点的两个位置之间的栅格,属于该多边形。
● 边界代数填充法:对含有多边形信息的弧段文件,沿其前进方向逐栅格搜索。
弧段上行∶弧段左边的栅格点赋值=左多边形特征码-右多边形特征码
弧段下行:弧段左边的栅格点赋值=右多边形特征码-左多边形特征码。

2.栅格转矢量

步骤
step1.图像二值化
step2.细化或提取边界点和节点
step3.边界线跟踪和生成的拓扑关系
目的是将细化处理后的栅格数据,整理为从结点出发的线段或闭合的线条,并以适量形式存储。
step4.删除冗余取点
方法
边界的检索——双边界直接搜索法
让左右多边形信息保存在边界点上,每条边界弧段由两个并行的边界链组成,分别纪录该边界弧段的左右多边形信息。
边界点和节点的提取:

线的细化——剥皮法
每次剥离一个栅格宽的一层像元,直至省下彼此连通的由单个栅格组成的图形。将栅格转换成点,并依次连通,生成线段。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
浅析GIS大数据 作者:尤文辰 徐跃通 高尚 来源:《电脑知识与技术》2013年第24期 摘要:随着地理信息数据的迅速增加,GIS数据呈现出数据量大、数据种类多和 数据结构复杂的特点。该文从大数据的角度对GIS数据呈现的三个特征进行了具体的分析 ,并在此基础上提出GIS大数据存储和处理的新的要求。最后介绍了MongoDB这一NoSQL数 据库的特性,简要分析了利用MongoDB数据库的特性来解决GIS大数据问题的方法,并简 单地借助于python语言用mongoDB对ESRI Shapefiles进行了存储。 关键词:GIS;大数据;mongoDB;python;开源GIS 中图分类号:TP208;TP392 文献标识码:A 文章编号:1009- 3044(2013)24-5399-04 1 概述 随着人类对客观世界认知的提高与技术水平的不断进步,所获取的描述客观世 界的数据呈爆炸式增长,大数据已经成为了Google、亚马逊等大公司的竞争资本,通过 大数据的有效利用和深入分析,可以挖掘巨大的商业价值和社会价值。根据维基百科[1 ]的定义,大数据是由巨大且复杂的数据集组成的集合,且这些数据集因其巨大和复杂而 难以用现有的数据库管理工具和传统的数据处理程序来进行处理。近些年我国开展的土 地调查、数字城市建设等项目,取得了丰硕的成果,收集了大量的测绘数据和自然、人 文数据,在今后大力开展的测绘工作中,还将获得更加丰富的地理信息数据,与此同时 ,如何有效地存储、管理和利用这些地理信息数据成为需要解决的问题。 2 GIS的定义 GIS(Geographic Information System)是地理信息系统的简称。陈述彭认为地理信息系统是以定位数据库为基础,具 有多层次数据结构,多功能分析能力的空间型信息系统[2],李德仁从多级格网理论[3] 的角度出发,认为GIS数据存储的形式为不同尺度的空间数据库[4]。综上所述,GIS是以 计算机软硬件为基础,结合地理学、测绘学、地图学、计算机科学、运筹学等多门学科 的,以获取、存储、管理、展示、分析地理空间数据为主的计算机系统,可以用于区域 规划、决策分析等。 3 GIS数据的特征 从定义可看出,数据是GIS的血液。从通过图件扫描、格式转换、实地测绘等方 法的数据获取,到采用各种先进数据库技术对数据进行存储、管理,再到利用计算机图 形学、地图学等综合可视化技术对数据进行展示,以及最终以数据为基础的借助于计量 地理学、拓扑学、图论等学科的决策分析等,这些过程都是以数据为核心的。随着GIS的 发展,其数据呈现出数量大、种类多和结构复杂的特征。 3.1 数量大 GIS的数据量大具有两层含义,第一层含义是指数据占用的字节数多,这主要是 针对栅格数据及多媒体数据而言的。比如"天地图"在2011年正式上线的时候,集成了海 量的基础地理信息资源数据[5],总数据量约有30TB,处理后的瓦片数近30亿。资源三号 测绘卫星是中国第一颗民用高分辨率光学传输型测绘卫星[6],截止到2013年6月底,在 运行的不到一年半的时间中,总共存档卫星影像37万多景,数据量达到249TB。而GIS空 间数据产生的商业价值每年正以15.5%的速度增加,是GIS软件和服务的两倍[7]。GIS数 据量大的第二层含义是指数据单位个数多。比如"天地图"各类地名和POI(Point of Interest,兴趣点)有1100多万条, 2011年8月竣工的国家西部1 50000地形图空白区测图工程和国家1 50000基础地理信息数 据库更新工程两个国家级重大测绘工程[8],成果有20多万航片和8000多景卫星遥感影像 ,地名近600万条,描绘了1.4亿个地理要素。另外,其他专业领域比如土壤数据、气象 数据在全数据模式下[9]数量也是非常可观的。 3.2 数据种类多 GIS的数据种类多样,从大的方面看,具有矢量数据、栅格数据、属性数据,以 及与地理位置相关的音频、视频等多媒体数据等;而从小的角度看,主要是因为数据来 源广泛和不同应用的需求而体现为数据格式多样,这里我们主要从数据格式多样来看GI S数据种类多。比如测绘方式产生的dxf数据,经常需要导入到GIS系统中,其他的还有扫 描得到的tiff或jpeg图像,具有空间坐标信息的GeoTIFF文件,数字制图中数字化后的E SRI shapefiles数据或MapInfo的TAB数据,格式转换后用于web的png、SVG或GeoJson数据等 。资源三号卫星TLC(三线阵相机)标准产品中的1A级产品(预处理级辐射校正影像产品 )包括的文件格式就有tiff、rpb、xml、jpeg等四种格式的15个文件。GDAL/OGR是地理 空间数据转换的类库,多用来读取地理空间数据,根据GDAL官方网站的资料
GIS地理信息系统)应用中的数据结构是指用于存储和表示地理空间数据的方式和格式。常见的GIS数据结构包括以下几种: 1. 点(Point):代表地理空间上的一个点,通常由坐标(经度和纬度)或者投影坐标表示。 2. 线(Line):由多个点连接而成,代表地理空间上的一条线段或路径。常见的例子是道路、河流等。 3. 面(Polygon):由多个点组成的闭合区域,代表地理空间上的一个面。常见的例子是土地覆盖类型、行政区划等。 4. 栅格(Raster):将地理空间数据划分为规则的网格,每个网格单元包含一个数值或属性值。常用于表示遥感影像、数字高程模型(DEM)等连续型数据。 除了上述基本的几何要素外,GIS数据结构还可以包含其他属性信息,如地物名称、属性值、时间戳等。这些属性信息可以与几何要素关联,以提供更丰富的地理信息。 在GIS应用中,常用的数据结构包括矢量数据结构和栅格数据结构。矢量数据结构以几何要素为基础,适用于描述离散型地理对象;而栅格数据结构以网格为基础,适用于描述连续型地理表面。不同的数据结构在不同的应用场景下有不同的优势和适用性。 总的来说,GIS应用中的数据结构是用于存储和表示地理空间数据的方式,能够有效地组织和管理地理信息,支持地理分析、空间查询和可视化等操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值