对当初学习地理信息系统概论时的笔记进行的总结,希望可以给没有GIS基础又想学习GIS的同学一点帮助。
如何把有关的空间数据组织到计算机系统中?
客观的地理系统包括自然环境系统和社会经济环境系统
1)确定专题领域实际模型;
2)建立表达实际模型的概念模型;
3)建立为实现概念模型的数据结构;
4)确定数据文件在数据库中的组织方式。
空间实际模型:指在研究区(项目所相关的空间区域)内与某领域有关的实际存在的物质世界,它包含所有能够被人们直接和不能直接观察到的各种有关信息。
空间数据模型:对有关真实世界的一种抽象表达,可称为概念模型。
空间数据结构:把概念模型转变为计算机系统所能接受的数据结构和逻辑关系。
空间信息特点:1.空间性空间位置:坐标数据 不同坐标之间可以转换空间位置关系:拓扑关系2.属性:属非空间数据3.时间性:空间特征、属性特征独立地随时间变化
空间实体的属性信息分类:
二元型:有、无;是、否。
等级型:地位级、火险等级。
数量型:面积、长度、重量等。
非数量型:坡向、坡位、植被类型等。
空间实体的度量信息:定位信息:点、线、面等用坐标对、坐标串、闭合坐标串描述。
1、拓扑关系概念:
拓扑关系是明确定义空间关系的一种数学方法。在GIS中,用来描述并确定空间的点线面之间的关系及属性,并可实现相关的查询和检索。
2、拓扑关系特点:
1)独立于坐标系统的几何关系;2)不随几何实体平移 旋转 缩放而变化
拓扑关系反映了空间实体间的逻辑关系,不需要坐标、距离信息,不受比例尺限制,也不随投影关系变化。
理解拓扑变换和拓扑属性时,我们可以设想一块高质量的橡皮,它的表面是欧几里德平面,可被任意拉伸压缩,但不能扭转折叠。表面上有由结点、弧、环和区域组成的图形。若对该橡皮进行任意拉伸、压缩,但不扭转和折叠,则在橡皮形状的这些变换中,图形的一些属性将得到保留,有些属性将消失。
拓扑属性:一个点在一个弧段的端点;一个弧段是一个简单的弧段;一个点在一个区域的边界上;一个点在一个区域的内部;一个点在一个区域的外部;一个面是一个简单的面(无岛);一个面的连通性。
非拓扑属性:两点之间的距离;一个点指向另一个点的方向;弧段的长度;一个区域的周长;一个区域的面积。
3、空间对象的拓扑空间关系
拓扑元素
点:孤立点、线的端点、面的首尾点、链的连接点
线:两结点之间的有序弧段,包括链、弧段和线段
面:若干弧段组成的多边形
基本拓扑关系:
关联:不同拓扑元素之间的关系
邻接:相同拓扑元素之间的关系
包含:面与其他元素之间的关系
层次:相同拓扑元素之间的层次关系
欧拉公式:欧拉公式在GIS中有着重要的意义,主要用来检查空间拓扑关系的正确性,能发现点、线、面不匹配的情况和多余、遗漏的图形元素; Npl=NA+1-ND
拓扑关系的关联表达是指采用什么样的拓扑关联表来表达空间位置数据之间的关系。
1)全显式表达
2)半隐式表达
1)全显式表达既明确表示空间数据多边形、弧段、结点之间的拓朴关系,同时还明确表达结点、弧段、多边形之间的拓扑关系。4个表格;
2)半隐式只有一个表格即可,其他的可由此表推出。
确定空间数据模型的基本原则:
1、把所基本空间信息储存于计算机介质中
2、便于对数据库信息的复原、查询、分析和处理等的高效与可能性
一、.规则格网式空间数据模型(栅格数据模型):空间单元人为划定成大小相等的正方形网格,有着统一的定位参照系。每个空间单元只记录其属性值,而不记录它的坐标值。
(一)栅格数据模型特点:
1.用离散的量化栅格值表示空间实体
2.描述区域位置明确,属性明显
3.数据结构简单,易与遥感结合
4.难以建立地物间拓扑关系
5.图形质量低,数据量大
每个栅格元素只能取一个值,实际上一个栅格可能对应于实体中几种不同属性值,存在栅格数据取值问题,解决方法:
1、面积占优法:栅格中占最大面积的属性值为栅格的属性值
2、长度占优法:将网格中心画一横线,用横线所占最长部分属性值作为栅格属性值。
3、中心点法:将栅格中心点的属性值作为栅格属性值。
4、重要性法:某些主要属性,只要在栅格中出现就把该属性作为栅格属性值。
(三)栅格数据的获取
1、目读法:适用于所选区域范围小,栅格单元尺寸大的情况。
2、从扫描仪获取:高精度,快速度,数据格式标准化。
3、从摄像机获取:栅格元素数固定 512×512 1024×1024
4、从遥感中获取:周期性,动态性,可自动提取专题信息。
5、从矢量数据转换成栅格数据
二、面向实体的空间数据模型(矢量数据模型)
把连续的空间按实体集中,每个实体分割成空间单元,记录描述它们位置的坐标数据。必须有一个参照坐标系和划分地理实体的分类系统,坐标系决定矢量数据模型的精度。
(一)矢量数据模型的特点
1、用离散的点或线描述地理现象及特征
2、用拓扑关系描述矢量数据之间关系
3、面向目标的操作
4、数据结构复杂且难以同遥感数据结合
5、难于处理位置关系
(二)矢量数据的获取
外业测量获取(如GPS);用跟踪数字化方法获取数据;从栅格数据转换成矢量数据
空间数据结构:
空间数据结构:把概念模型转变为计算机系统所能接受的数据结构和逻辑关系。
(一)二维矩阵数据结构l
在数据无压缩的情况下,栅格数据按直接编码顺序进行存储。
所谓直接编码,是将栅格数据看成一个数字矩阵,数据存储按矩阵编码方式存储,即把规则格网平面作为一个二维矩阵进行数学表达,每个栅格是具有行、列位置的矩阵元素,该空间实体属性编码值赋予矩阵元素。
基本要素包括:行,列,属性值(N,M,Xij) 其中行、列值隐性,属性值显性。
优点:1、易于实现用循环语句编程,实现快速运算
2、易于实现空间属性的分解与分类,易于实现空间分析中叠加等操作
缺点:数据存储量大
(二)费尔曼链码 (边界编码)
曲线或边界中有一点(i,j)其相邻栅格在8个邻域方向上。
优缺点: 数据压缩率强,便于计算长度,面积,便于表示图形凹凸部分,易于储存。但难于实现叠置运算,不便于合并插入操作。适于对曲线和边界进行编码。
(三)游程(行程)编码
适于对块状地物的栅格数据进行压缩编码。
游程:以行为单位,将栅格数据矩阵中属性相同的连续栅格视为一游程。
分为游程终止编码和游程长度编码
编码方式:(gk,lk)
gk—栅格属性值
lk —游程终止列号或长度
K=1,2,3,4…..m(m<n)
游程编码优点:数据压缩率高,易于实现叠置,检索运算。
缺点:只考虑水平分解元素之间相关性而未考虑垂直分解元素之间相关性,又称一维游程编码。
(四)块状编码
以正方形区域为单元对块状地物的栅格数据进行编码,实质是把栅格阵列中同一属性方形区域各元素映射成一个元素系列。
编码方式:(行号,列号,半径,代码)
块码特点:1、面状地物所能包含的正方形越大,多边形边界越简单,块码编码效率超高;2、图形比较碎,多边形边界复杂的图形,数据压缩率低;3、利于计算面积、合并插入等操作。
(五)四叉树编码(Quadtree Code)
1、常规四叉树基本思想
把一幅图像或一幅栅格地图等分成4部分,逐块检查其栅格值,若每个子区都含有相同值,则该子区不再往下分割,否则将该区域再分割4个子区域,如此递归分割直到每个子块都含有相同的灰度或属性为止。
不能再分的块构成为树的叶结点,有值的叶结点为黑结点,没有值的结点为白结点。N为树的高度(深度),对一幅2^N ×2^N的栅格阵列,最大深度为N,可能有的层次为0,1,2,…,N,那么,每层的栅格宽度为:2^(最大深度-当前层次)
2.线性四叉树
以四叉树的方式组织数据,但不以四叉树方式存储数据。通过编码四叉树的叶结点表示数据的层次和空间关系。叶结点具有一个反映位置的关键字,亦称位置码。实质是把原来大小相等等栅格集合转换成大小不等的正方形集合,对不同尺寸和位置的正方形集合赋予一个位置码。
3)基于十进制的线性四叉树编码
将二进制的行列号按位交错排列,可得到四叉树叶结点的二进制地址码,进而将二进制码转成十进制码,得到四叉树编码。
表a经自下而上归并得表b。依次检查表a中四个相邻叶结点的属性代码是否相同。若相同则归并成一个父结点,记下地址及代码。否则不予归并。然后再归并更高一层父结点,如此循环,直到不能归并为止。
![967fd267329bae63930d45c0f9784424.png](https://i-blog.csdnimg.cn/blog_migrate/1575927a612ade00e616cac2a8115bc4.jpeg)
特点:比四进制节省储存空间,且前后两个MD码之间差代表了叶结点的大小,还可进一步利用游程编码对数据进行压缩。优点:具有可变分辨率,能精确表示图形的细节部分,编码效率高;具有区域性质,适合于图形图像的分析运算;便于岛的分析。
四进制线性四叉树编码的特点:优点是便于实现行列值及其编码之间的转换;缺点是存储开销大,且一般软件都不支持四进制。
![fc7f8a08773700b34071b4d4f4e95243.png](https://i-blog.csdnimg.cn/blog_migrate/da5f9b9a724396453ae990ec3a825be5.jpeg)
二、矢量数据结构
面实体地图的描述和定义:
(1)从图论空间来看,一个地图G=(a , p)被看成是由顶点集(p)被边集(a)所连接的网,可称为多边形网;
(2)每个面实体(称为多边形)是由一组点子集或线子集所定义;
(3)每个多边形是在一定的约束条件下某些线实体所构成的回路;
(4)线与线实体呈链接关系而无交叉关系;
(5)面实体之间有邻接和叠合包含关系;
(6)叠合包含关系可分半岛式及岛屿式;
(7)邻接多边形之间至少必有一个公共边(弧);
(8)一条弧是由若干个点所组成,首、尾端点称为首结点和尾结点;
(9)在一般情况下,一个结点至少连接三个以上的弧;
(10)岛屿多边形与半岛多边形首尾结点重合,它们本身只有一条弧,但连接半岛多边形的结点除了引出半岛多边形的弧之外,还至少引出另外两条以上的弧;
(11)一幅地图上的多边形类型除了一般多边形、岛屿多边形、半岛多边形之外,还必有一个图幅边界多边形;
12)在由一般多边形和边界多边形构成的地图情况下(假设没有岛屿多边形及半岛多边形)在该幅地图上多边形、结点与弧的关系可由下式所定义:
Npl=NA+2-ND
其中, Npl——多边形的个数; NA——弧数 ;ND——结点数
一)面实体的非拓扑结构简单表达方法及相应的数据结构
1.面实体简单的矢量表达方法
逐一对每个多边形进行表达,把每个多边形表达成一组边(弧)上的X与Y坐标。
优点:
数据结构最简单,一个多边形是一个闭合的曲线,不被分解成弧段,也用不着考虑岛屿和半岛多边形的问题
缺点:
1)相邻两多边形之间的界线数字化和储存两次,公共边界两次数字化的数据不可能完全相同,会出现一些空隙
2)该方法不能产生邻域信息,拓扑信息,空间分析和查询困难。
3)岛作为一个单个图形,没有与外界多边形联系。不易检查拓扑错误。 所以,这种结构只用于简单的制图系统中,显示图形。
2.带有索引的多边形矢量表达方法
一幅面实体地图可以分解成若干个多边形,一个多边形可以按边界相交的结点分解成若干弧段。一个弧段是一组X、Y坐标定义的线段,邻接多边形的公共边界线只被数字化和储存一次。同时,单独记录地图、多边形、边(弧)之间关系的信息。可以构造一种数据结构,把各条弧的坐标及地图要素之间的关系分开储存。对所有点的坐标按顺序建坐标文件,再建点与边(线)、线与多边形的索引文件。
索引式面实体的典型应用:在ArcView中,每个图形文件包括三个数据文件:
1、.shp文件:存储各地图要素的坐标数据和几何数据;
2、.shx文件:存储地图要素间的隶属关系;
3、.dbf文件:存储地图要素的属性数据。
优点:
1)消除多边形数据的冗余和不一致
2)邻接信息、岛信息可通过查找公共弧段号的方式查询。
缺点:
1)表达拓扑关系较繁琐
2)给相邻运算、处理岛信息、检索拓扑关系等带来困难
3)以人工方式建立编码表,工作量大,易出错。
(二)基于面向空间实体数据模型的拓扑向量数据结构
1.表达拓扑向量数据结构的策略:
(1)以弧为基本单元进行数字化,记录坐标值,形成坐标数据;
(2)由坐标数据提取弧和结点数据;
(3)由结点、弧及坐标数据产生表达面实体拓扑关系的数据。
地理信息系统面状要素拓扑关系数据文件:
.cor:坐标数据文件 .idx:弧索引文件 .alt:结点文件 .pat:多边形文件 .lrp:弧的左右多边形文件 .bnd:图幅边界点数据文件 .lab:标注文件.dbf:属性文件
两种数据结构的比较
矢量数据:
1.优点:•表示地理数据的精度较高•数据结构严谨,数据量小•完整的描述空间拓扑关系图形输出精确美观•图形数据和属性数据的恢复、更新、综合都能实现•面向目标,不仅能表达属性,而且能方便的记录每个目标的具体属性信息
2.2.缺点:•数据结构复杂•矢量叠置较为复杂•数学模拟比较困难•技术复杂,对软硬件要求高
栅格数据:
1.优点:•数据结构简单•空间数据的叠置和组合方便•各类空间分析很易于进行•数学模拟方便
2.缺点:•图形数据量大•降低分辨率,精度和信息量受损•地图输出不美观•难以建立网络连接关系•投影变换比较费时
将矢量栅格数据统一起来,建立矢量栅格一体化数据结构,是目前GIS界研究的DTM概念:是对连续变化的地形起伏进行数字表达,是带有空间位置特征和地形属性特征的数字表达。包括高程、坡度、坡向及其他地貌特征等。
DEM概念:DTM中的地形属性为高程时,称为数字化高程模型(DEM)。
方向之一。
一、数字化高程模型的表达方法
1、高程矩阵模型(DEM)
假定把一个有规则的格点网铺放在地面上,除了记录平面位置外,还记录高程数据。由此可产生一高程矩阵来描述地形变化。矩阵元素反应出各抽样点的高程,而平面位置暗含于各元素的位置中。在计算机实现中是一个二维数组。
高程数据的获取:
1、用现存的地形图进行数字化
2、在航空象片上用摄影测量方法来获取
3、内插方法
优点:机械布点、取点容易,容易通过该模型提取坡度、坡向、地形结构信息及建立三维透视图等。
缺点:a.在均匀平缓的地形情况下回有着大量的重复数据;
b.复杂的地形,整体网格的布设密度又可能显得太粗,不能很好地表达出山脊线谷地线等地貌特征;
c.栅格式高程矩阵只着重沿两轴方向做各种数据处理,然而地形变化并不总适合两轴方向的数据处理。
2、平行剖面线模型
概念:如果在地形图上获得数字化高程时,按一定方向平行的做剖面线,相当于网格线的纵线或横线,按这些线于等高线相交设模型点。
高程数据的获取:地形图
特点:只保留一维的向量方向,在这方向上可以随地貌的变化,其抽样点自然会加密或稀疏其布点;可以使用游程编码数据结构。
3、等高线数字模型
概念:布点不遵守行、列规则布点,而是按等高线的弯曲布设,对每条等高线进行数字化。
获取:地形图
特点:可以用矢量非拓扑数据结构表示,每条等高线作为一个记录,记录高程值、抽样点数和每个抽样点的X及Y坐标。该方法易于等高线的输入和复原。
4、不规则三角网络模型(TIN 模型)Triangulated Irregular Netword
概念:TIN模型是一系列各自具有相同坡面的三角形平面来拟合地形表面。
获取:地形图
特点:每个三角形的选取要代表某一斜平面的临界点。在地形图上可以人为直接的或按着一定规定确定出三角形,进而建立起不规则三角形网络模型。TIN的模型不受事先规定布点方式的限制,能够较好的表达地形特点。需要建立拓扑关系时,用两个数据文件就可以表达出所需要的拓扑关系。即结点文件和三角形文件。
二、地形结构的数学模拟
1.麦特朗(G.MATERAN)假说
任何地理空间变动可以用三个重要成分表示:
1)地形的结构成分,它与固定平均数或固定的趋势有关;
2)与空间位置有关的随机成分;
3)一个随机的噪音或称残差项
2.函数表达:
空间位置X的高程值为:
![b224413c8335ccb12ba25e5ede17c301.png](https://i-blog.csdnimg.cn/blog_migrate/83e3714478ae18602284d0574ee78305.png)
其中:m(x)是决定函数,描述z在x点上的结构成分;
ε'来自的非独立性残差随机量;
ε"独立的高斯噪音项,期望值为0
3、地形结构分类
1) 平面:该平面上高程变化的数学期望值等于零,即:
E [Z(x) - Z(x+h)]=0 , h---区域向量半径变量。
2)斜面:在区域内,高程特征值Z沿着切面单调地增加或减少,称为线性关系即:
Z=b0+b1·x
Z=b0+b1·x+b2·y
3)非线性曲面:区域内地形显现为更为复杂的曲面,可用二次多项式或高阶多项式来表达。
三、地理空间数据的内插方法
四、1、基本概念:
插值:根据一组已知的数据点,构造一个函数,使已知的数据点全部通过该函数,并用该函数求出其它位置数据点值,这种方法称为插值法,所构造的函数称为插值函数。
逼近:根据一组已知的数据点,构造一个函数,使已知的数据点整体上接近该函数,但不必通过全部数据点但所构成的函数与已知数据点之间误差在某种意义上插值最小。
拟合:通常将插值和逼近统称为拟合。
3、GIS常用的内插函数
1)基本剖面的线性插值
2)距离倒数加权内插函数(INSERT DISTANCE WEIGHTED——IDW)
假定每个输入点都有着局部影,这种影响随着距离增加而减弱。
3)移动区域及样条内插方法(SPLINE FUNCTION )
用一数学函数去拟合指定数量的最近输入点,使曲面通过这些抽样点。如果在很短的水平距离内趋势面有很大的落差,会产生较大的误差
4)克瑞钦(KRIGING)内插函数
定义:克瑞钦插值是以空间自相关性为基础,利用原始数据和半方差函数的结构性,对区域化变量的未知采样点进行无偏估值的插值方法。又称克里格法
克瑞钦内插法与最小二乘法区别:
二者比较类似,也是将空间变化分为趋势、信号和误差三部分,求解过程也比较相似。 不同之处在于所采用的相关性计算方法上,最小二乘法采用协方差矩阵,而克瑞钦法采用半方差,或者称半变异函数
5)趋势(TREND)内插函数
用最小二乘法(LEAST SQUERES REGRESSION)拟合所有的输入点,得到趋势内插函数。所获得的趋势面不能通过全部输入点。
l该方法理论基础严密,但大量实验结果表明,它未必能在DEM内插中取得良好效果,原因在于:最小二乘法的前提条件是处理对象必须属于遍历性平衡随机过程,但实际地形表面变化复杂,不一定满足这一条件,而且地形之间的自相关性不仅与距离有关,也与方向有关,即地形具有各向异性。另外最小二乘法的解算是一个循环迭代的过程,计算量较大。
6)区域内插算法
有些采样数据不是均匀变化的,有些数据经专业处理后表达为在各个不同分区中同质或线性变化,这就导致区域之间值的变化在相邻边界处不连续。这种情况有时既不符合现实情况,也不满足连续光滑的假设条件。因而,需要对这些数据进行区域内插,使得数据在边界连续。区域内插包括点在区域内的内插和面的区域内的内插两种类型。
(1)点的区域内插算法
已知某种特征数据的分布情况,要求解某待定点的特征值。首先要确定该点位于哪一分区中,然后根据该分区内特征值或其变化规律,内插确定待定点的特征值。所用算法包括两部分,一是点在多边形内的判断;二是点在区域内的线性插值。
(2)面的区域内插算法
面区域内插的实质是根据某一地区的一组已知分区(称为源区,source region)的已知数据,推求同一分区(目标区,target region)的另一组分区的未知数据。这是GIS的一个非常有用的内插方法,在区域统计、数据挖掘方面有广泛的用途。有两种方法,即叠置法和比重法。
叠置法
叠置法的前提是认为在源区和目标区内数据是均匀分布的。求解时,将目标区叠合到源区上,求出源区和目标区之间的交集。
比重法:
比重法是根据平滑密度函数原理,将源区的统计数据从同质性改变成非同质性,然后进行区域插值。更符合实际。
四.由数字化高程模型提取区域信息
1、局部平均高程计算
2、坡度计算:高度的变化率
地表面任一点的坡度是指过该点的切平面与水平地面的夹角。
3.坡向:区域方向,即变化比率最大的方向。
定义:地表面上一点的切平面的法线矢量在水平面的投影与该点的正北方向的夹角。从拟合平面的法线在水平面上的投影方位角确定,然后将方向角进行分级,分成8个区域,合并成阳坡、阴坡、半阳、半阴四个区域。
4、地形起伏度
地形起伏度是指在一个特定的区域内,最高点海拔高度与最低点海拔高度的差值,它是描述一个区域地形的宏观性指标。
5、地面粗糙度
地面粗糙度是指在一个特定的区域内,地球表面积与其投影面积之比,它是反映地表形态的一个宏观指标。
6、谷点和脊点计算
谷点和脊点是地面形态的重要特征,在地面分析中具有重要意义。谷点是地势的最低点,地势的相对最低点集合为谷;脊点是地势的最高点,地势的相对最高点的集合为脊。
三维表达:
1、透视表达法 2、阴影表达法
(一)透视表达法
利用二维矩阵的数字化高程模型数据,根据栅格点高程进行透视变换,使用纵横的透视网格线产生人们的立体视觉。
(二)阴影表达法
利用人们对物体阴阳面反差的视觉感应会产生立体的视觉映射。
1975年Pong提出计算机绘图的照度模型,地表某一点的照度是由地表的镜面反射、漫反射及环境空间综合影响三个因子的线性组合。镜面反射影响,环境空间影响是个常数,只考虑地表漫反射的影响。
朗伯特法则:
其中,I—反射光强;I0 —入射光强;K —常数; θ—入射角
cosθ=N·L
N:---地表特征的组合向量
L---太阳光源方向的组合向量
太阳方位角:太阳光线在地平面上的投影与当地子午线的夹角,可近似看作竖立在地面上的直线在阳光下的阴影与正南方的夹角。
太阳高度角:从太阳中心直射到当地的光线与当地水平面的夹角。
计算机算法:
(1)确定太阳高度角和方位角。可估计或查天文年历;
(2)调入数字化高程模型数据(二维矩阵数据);
(3)设置8邻域窗口;
(4)提取窗口内南北和东西两个方向上的坡度(δz/δy和δz/δx)。
(5)按反射光强度模型计算出各求值点的反射光强度的相对值。
(6)把个点的反射光强度值转换成灰度值,进行计算机绘图。
元数据是用来描述该数据集的基本特征和总体内容的数据信息,由4个层次构成:
1)元数据元素:说明地理空间数据某一个方面的特征,相当于字段
2)元数据实体:一个或若干个元数据元素组成元数据实体
3)复合实体:由元数据实体、元数据元素和(或)其他复合实体构成
4)元数据子集:有若干元素、实体或复合实体组成的集合。
空间区域框架:就是按区域储存和表达空间信息的一套规则。
1、分为:自然区域框架,行政区域框架,自然-行政综合区域框架,和地理网格区域框架。
2、地形图都是以地理网格区域框架作为储存和表达空间数据的基础。一般的专题图或以所研究的自然区域,或行政区域,或以自然-行政综合区域框架为基础。
图层概念:计算机内二维阵列中的每个单元仅能容纳一个数值,为表达不同的地图数据,必须被分离成不同的二维阵列来储存,每个储存层及储存的数据被称为图层 。
图层结构:不同的图层组织在一起形成了图层结构。
数据库概念: 一个数据库就是有关事物及其它们彼此之间关系的信息集合,这些信息的集合是按一定的数据模型和逻辑结构被储存一个或多个适合于计算机的数据文件之中。
计算机对数据的管理
经历的三个发展阶段:
1、程序管理阶段:
2、文件管理方式:顺序、随机、索引、倒排文件等
3、数据库管理系统:层次模型、网状模型和关系模型等
GIS空间数据库组织与管理
1)混合式结构
(1)地图数据(空间数据)采用文件处理方式,应用程序知道每个数据文件的数据结构。
(2)属性数据采用数据库管理方式(DBMS),如dbase,foxbase,Oracle等。
(3)图形数据与属性数据的连接根据属性表中的唯一公共标识来连接。
2)一体化空间数据库
ArcGIS 中的SDE集成方式体现了使用一体化的空间数据库的结构。
SDE扩展了传统的关系数据库只存储和管理属性数据的模式,允许把空间数据加入到关系数据库,提供地理要素的空间位置几何形状等信息。
![0b4042cae6828dcfa5984e73c99c798a.png](https://i-blog.csdnimg.cn/blog_migrate/a5f06f0b52265a1d3add4d7515745045.jpeg)
空间数据质量
误差来源:数据收集、数据录入、数据存储、数据处理、数据输出、数据应用。
质量控制:准确度、精度、不确定性、相容性、一致性、完整性、可得性、现势性。
准确度:与真值的接近程度;
精度:对象表达的详细程度
不确定性:不能精确描述的对象
相容性:两个来源数据在同一应用中的难易程度
一致性:同类现象表达的一致性
完整性:数据的完整性
可得性:数据获取的容易程度
现势性:数据反映对象目前的程度
现势性:数据反映对象目前的程度
由拓扑向量数据结构向网格数据结构变换
要点:
①确定栅格元素的大小,即分辨率。如地形起伏大应用高分辨率
②了解矢量数据和栅格数据的坐标。如矢量数据的坐标是直角坐标系,原点在图的左下方,栅格数据坐标是行列坐标,原点在图左上方,转换时,一般使直角坐标系的x,y轴与栅格数据行列平行
![4c8822a881f9f84f22fb3ec3a7f329d2.png](https://i-blog.csdnimg.cn/blog_migrate/1437a67c18605d63004fe29a966c0b7c.jpeg)
③转换公式:
△X=(Xmax-Xmin) / J
△Y=(ymax-ymin) / I
其中:xmax xmin ymax ymin 表示矢量坐标中x,y的最大值,最小值。
I,J表示栅格的行数和列数△x△y表示每个栅格单元的边长
基本要素的转换
(1)点的转换
行 i=1+Integer[(ymax-y)/△y]
列 j=1+Integer[(x-xmin)/△x]
Integer---取整
i,j---行,列值
(2)线的转换
线的转换实质是完成相邻两点间直线的转换。
设直线AB端点坐标为A(x1,y1),B(x2,y2)则需把A,B两点矢量坐标转换成栅格数据,同时求出直线AB经过的中间栅格数据。
1 利用点转换法,将A,B转换成栅格数据,求出行列值
2 由上述行列值求出直线所在行列范围3 确定直线经过的中间栅格点
步骤:求出直线经过的起始行号为i1,终止行号为im,则中间行号为i2,i3……im-1。现在要求相应行号相交于直线的列号
1)求相应i行中心处同直线相交的y值y=ymax-△y(i-1/2)
2)用直线方程求y值对应的x值X=(x2-x1)(y-y1)/(y2-y1)+x1
3)由x,y值求相应i行的列值j
J=1+Integer[(x-xmin)/△x]
如此不断求直线经过的各行的列值,完成转换。
![b9141bccec6f7a1de1d9be2e0b97a9ed.png](https://i-blog.csdnimg.cn/blog_migrate/2b62b5ce9aee5177fa21ea48c08e488e.jpeg)
例:已知某矢量坐标系,坐标原点为O(0,0),X坐标的最大值为150,Y坐标的最大值为300,其中有两点P1和P2,坐标分别为P1(51,100)、P2(53,103)试将P1、P2所连成的直线转为栅格坐标,栅格坐标系的分辨率为300 行×150列 。
![9766dba933c6685102148c88caa71d02.png](https://i-blog.csdnimg.cn/blog_migrate/92fe3fe1320d6999e4cd3e8af19a88e1.jpeg)
△X=(Xmax-Xmin) / J =1
△Y=(ymax-ymin) / I =1
P1点的行列值:i=1+Integer(300-100)/1=201;j=1+Integer(51-0)/1=52
P2点的行列值:i=1+Integer(300-103)/1=198;j=1+Integer(53-0)/1=54
直线经过的行范围:198-201
199行中心处同直线相交的y值:y=300-199*1+1/2=101.5
该行y值对应的x值:x=(53-51)(101.5-100)/(103-100)+51=52
x坐标对应的栅格列值为:j=1+Integer(52-0)/1=53
200行中心处同直线相交的y值:y=300-200*1+1/2=100.5
该行y值对应的x值:x=(53-51)(100.5-100)/(103-100)+51=51.3
x坐标对应的栅格列值为:j=1+Integer(51.3-0)/1=52
P1、P2所连成的直线的栅格坐标为(201,52),(200,52),(199,53),(198,54)
(3)区域填充:射线法,边界点跟踪法,边界代数法,种子法
空间数据配准概念:是对空间数据进行几何变换,把地面坐标分配给地图数据进行地理编码,或对空间数据层(图层结构)之间进行空间位置的精确配准,以便使它们能够在空间分析时进行叠加操作。
过程:把不同的数据层配准到一个共同的坐标系统中,或配准到标准的数据层。
分类:共面变换和非共面变换