GIS基本理论之一：GIS的概念、构成结构、功能

最新推荐文章于 2025-04-16 09:57:03 发布

chemyzero

最新推荐文章于 2025-04-16 09:57:03 发布

阅读量4.5w

点赞数 11

分类专栏： GIS

GIS 专栏收录该内容

1 篇文章

订阅专栏

GIS基本理论之一：GIS的概念、构成结构、功能

1 地理信息系统的概念

地理信息系统(Geographic Information System 简称GIS)是一项以计算机为基础的新兴技术，围绕着这项技术的研究、开发和应用形成了一门交叉性、边缘性的学科，它是以地理空间数据库为基础，在计算机硬件的支持下，对空间相关数据进行采集、管理、操作、分析、模拟和显示，并采用地理模型等分析方法，实时提供多种空间和动态的地理信息，为地理研究和地理决策服务而建立起来的计算机技术系统。它的定义主要包含三个方面的内容：①GIS使用的工具：计算机软硬件系统；②GIS研究对象：空间物体的地理分布数据及属性；③GIS数据建立过程：采集、存贮、管理、处理、检索、分析和显示。

2 地理信息系统与相关技术(CAD、数字化制图)之间的关系

地理信息系统与事务信息系、CAD和数字化制图都有很大的关系，但它们之间又存在着很多的不同点。

与一般的事务信息系统相比，地理信息系统具有以下特征：①地理信息系统在分析处理问题中使用了空间数据与属性数据，并通过数据库管理系统将二者联系在一起共同管理、分析和应用，从而提供了认识地理现象的一种新的思维方法；而事务信息系统只有属性数据库的管理，不能进行有关空间数据的操作；②地理信息系统强调空间分析，通过利用空间解析式模型来分析空间数据；③地理信息系统的成功应用不仅仅取决于技术体系，而且依靠一定的组织体系；④虽然事务信息系统对地理信息系统的发展起着重要的作用。但实践证明，人的因素在地理信息系统得发展过程中越来越具有重要的影响作用，地理信息系统的应用问题已经超出了技术的范畴。

CAD是指计算机辅助设计，是采用计算机辅助进行各种设计，广泛用于机械、建筑、工程和产品设计方面。GIS是在CAD基础上发展起来的一门学科，设计制图同时也是GIS的重要功能。CAD和GIS的关系密切。二者都具有坐标参考系统，都能描述和处理图形数据，也能处理属性数据。根本区别在于使用目的不同，从而导致了功能和数据组织等方式上的区别。从使用目的来看，CAD主要偏向于制图和表达，而GIS更强调解决空间问题。因此，CAD的图形编辑功能较强，具有较强的排版和制图能力，GIS的核心功能是空间分析。GIS比CAD的图形数据具有更强的语义，表现在：①属性更为丰富；②空间对象之间的拓扑关系更强；③数据更海量。

数字化制图与地理信息系统从它们的形成开始一起到发展至今，都是紧密联系在一起，有时很难区分。地理信息系统从建立到应用的各个环节，都需要数字化制图方法作为技术保证。地理信息系统建立前必须对各种数据进行收集与处理，而处理图形和文字等非数字信息时就要采用数字化制图中数字化的方法与原理。数据库建造中，从编码到建库都必须遵循一定的数据结构，数据与数据之间形成的关系等均需应用有关数字化制图的知识。建库后的数据管理和更新也必须借助数字化制图原理。地理信息系统成果的图形输出，更需要运用数字化制图的图形输出方法。它们之间的不同主要有以下几个方面：①数字化制图的目的是快速、精确地编制高质量的地图，而地理信息系统则是为地理研究和地理决策提供服务；②它们在数据采集、处理、输出过程中的侧重点有所不同；③数字化制图是利用计算机及其输入输出装置，通过数据库技术和图形数字处理方法，来进行地图制图的工作。数字化制图的整个过程是以处理数字为主要内容。而这些数字载负了地图或地理信息的具体内容。有了完整、精确的地图数据库，都能借助于计算机的处理，提供查询、分析的评价制图信息，编成新的地图。

3 地理信息系统的构成结构

地理信息系统主要由四部分组成：即计算机硬件系统，计算机软件系统，空间数据及系统的组织和使用维护人员即用户。其核心内容是计算机硬件和软件，空间数据反应了应用地理信息系统的信息内容，用户决定了系统的工作方式。

计算机硬件系统是计算机系统中实际物理设备的总称，主要包括计算机主机，输入设备，存储设备和输出设备。

计算机软件系统是地理信息系统运行时所必需的各种程序。包括：①计算机系统软件；②地理信息系统软件及其支撑软件。包括地理信息系统工具或地理信息系统实用软件程序，以完成空间数据的输入、存储、转换、输出及其用户接口功能等③应用程序。这是根据专题分析模型编制的特定应用任务的程序，是地理信息系统功能的扩充和延伸。

空间数据是地理信息系统的重要组成部分，是系统分析加工的对象，是地理信息系统表达现实世界的经过抽象的实质性内容。它一般包括三个方面的内容：即空间位置坐标数据，地理实体之间空间拓扑关系以及相应于空间位置的属性数据。通常，它们以一定的逻辑结构存放在空间数据库中，空间数据来源比较复杂，随着研究对象不同，范围不同，类型不同，可采用不同的空间数据结构和编码方法，其目的就是为了更好地管理和分析空间数据。

地理信息系统是一个复杂的系统，仅有计算机硬件、软件及数据还不能构成一个完整的系统，必须要有系统的使用管理人员。其中包括具有地理信息系统知识和专业知识的高级应用人才；具有计算机知识和专业知识的软件应用人才以及具有较强实际操作能力的硬软件维护人才。

4 地理信息系统的功能

地理信息系统的核心问题可归纳为五个方面的内容：位置、条件、变化趋势、模式和模型。

⑴位置（Locations）

首先，必须定义某个物体或地区信息的具体位置，常用的定义方法有：通过各种交互手段确定位置，或者直接输入一个坐标；

其次，指定了目标或区域的位置后，可以获得预期的结果以及其所有或部分特性，例如当前地块所有者、地址、土地利用情况、估价等。

⑵条件（Conditions）

即什么地方有满足某些条件的东西

首先，可以用下列方式指定一组条件，如从预定义的可选项中选择选取；填写逻辑表达式；在终端上交互式填写表格

其次，指定条件后，可以获得满足指定条件的所有对象的列表，如在屏幕上以高亮度显示满足制定条件的所有特征，例如，其所位于的土地类型为居民区、估价低于200，000美元、有四个卧室而且是木制的房屋

⑶变化趋势（Trends）

该类问题需要综合现有数据，以识别已经发生了或正在发生变化的地理现象。

    首先，确定趋势，当然趋势的确定并不能保证每次都正确，一旦掌握了一个特定的数据集，要确定趋势可能要依赖假设条件、个人推测、观测现象或证据报道等。
    其次，针对该趋势，可通过对数据的分析，对该趋势加以确认或否定。地理信息系统可使用户快速获得定量数据以及说明该趋势的附图等。例如，通过GIS，可以识别该趋势的特性：有多少柑桔地块转作它用？现在作为何用？某一区域中有多少发生了这种变化？这种变化可回溯多少年？哪个时间段能最好反映该趋势？1年、5年还是10年？变化率是增加了还是减少了？
    ⑷模式（Patterns）
    该类问题是分析与已经发生或正在发生事件有关的因素。地理信息系统将现有数据组合在一起，能更好地说明正在发生什么，找出发生事件与哪些数据有关。
    首先，确定模式，模式的确定通常需要长期的观察、熟悉现有数据、了解数据间的潜在关系。
    其次，模式确定后，可获得一份报告，说明该事件发生在何时何地、显示事件发生的系列图件。例如，机动车辆事故常常符合特定模式，该模式（即事故）发生在何处？发生地点与时间有关吗？是不是在某种特定的交叉处？在这些交叉处又具有什么条件？
    ⑸模型（Models）
    该类问题的解决需要建立新的数据关系以产生解决方案。
    首先，建立模型，如选择标准、检验方法等。
    其次，建立了一个或多个模型后，能产生满足特定的所有特征的列表，并着重显示被选择特征的地图，而且提供一个有关所选择的特征详细描述的报表。例如要兴建一个儿童书店，用来选址的评价指标可能包括10、15、20分钟可到达的空间区域。附近居住的10岁或10岁以下的儿童的人数、附近家庭的收入情况、周围潜在竞争的情况。
    为了完成上述的地理信息系统的核心任务，需要采用不同的功能来实现它们。尽管目前商用GIS软件包的优缺点是不同的，而且它们在实现这些功能所采用的技术也是不一样的，但是大多数商用GIS软件包都提供了如下功能：数据的获取（Data Acquisition）、数据的初步处理（Preliminary data Processing）、数据的存储及检索（Storage and Retrieval）、数据的查询与分析（Search and Analysis）、图形的显示与交互（Display and Interaction）。
    地理信息系统功能包括以下的部分：数据采集、监测与编辑（手扶跟踪数字化）；数据处理（矢栅转换、制图综合）；数据存储与组织（矢量栅格模型）；空间查询与分析（空间检索、空间拓扑叠加分析、空间模型分析）；图形交互与显示（各种成果表现方式）。

下面分别来描述：

数据采集、监测与编辑主要用于获取数据，保证地理信息系统数据库中的数据在内容与空间上的完整性、数值逻辑一致性与正确性等。一般而论，地理信息系统数据库的建设占整个系统建设投资的70%或更多，并且这种比例在近期内不会有明显的改变。因此，信息共享与自动化数据输入成为地理信息系统研究的重要内容。目前可用于地理信息系统数据采集的方法与技术很多，有些仅用于地理信息系统，如手扶跟踪数字化仪；目前，自动化扫描输入与遥感数据集成最为人们所关注。扫描技术的应用与改进，实现扫描数据的自动化编辑与处理仍是地理信息系统数据获取研究的主要技术关键。

对数据处理而言，初步的数据处理主要包括数据格式化、转换、概括。数据的格式化是指不同数据结构的数据间变换，是一种耗时、易错、需要大量计算量的工作，应尽可能避免；数据转换包括数据格式转化、数据比例尺的变化等。在数据格式的转换方式上，矢量到栅格的转换要比其逆运算快速、简单。数据比例尺的变换涉及到数据比例尺缩放、平移、旋转等方面，其中最为重要的是投影变换；制图综合（Generalization）包括数据平滑、特征集结等。目前地理信息系统所提供的数据概括功能极弱，与地图综合的要求还有很大差距，需要进一步发展。

数据存储与组织是建立地理信息系统数据库的关键步骤，涉及到空间数据和属性数据的组织。栅格模型、矢量模型或栅格/矢量混合模型是常用的空间数据组织方法。空间数据结构的选择在一定程度上决定了系统所能执行的数据与分析的功能；在地理数据组织与管理中，最为关键的是如何将空间数据与属性数据融合为一体。目前大多数系统都是将二者分开存储，通过公共项（一般定义为地物标识码）来连接。这种组织方式的缺点是数据的定义与数据操作相分离，无法有效记录地物在时间域上的变化属性。

空间查询与分析是地理信息系统最核心的功能。空间查询是地理信息系统以及许多其它自动化地理数据处理系统应具备的最基本的分析功能；而空间分析是地理信息系统的核心功能，也是地理信息系统与其它计算机系统的根本区别，模型分析是在地理信息系统支持下，分析和解决现实世界中与空间相关的问题，它是地理信息系统应用深化的重要标志。地理信息系统的空间分析可分为三个不同的层次。首先是空间检索，包括从空间位置检索空间物体及其属性和从属性条件集检索空间物体。“空间索引”是空间检索的关键技术，如何有效地从大型的地理信息系统数据库中检索出所需信息，将影响地理信息系统的分析能力；另一方面，空间物体的图形表达也是空间检索的重要部分。其次是空间拓扑叠加分析，空间拓扑叠加实现了输入要素属性的合并（Union）以及要素属性在空间上的连接(Join)。空间拓扑叠加本质是空间意义上的布尔运算。第三是空间模型分析，即在空间模型分析方面，目前多数研究工作着重于如何将地理信息系统与空间模型分析相结合。其研究可分三类：第一类是地理信息系统外部的空间模型分析，将地理信息系统当作一个通用的空间数据库，而空间模型分析功能则借助于其它软件；第二类是地理信息系统内部的空间模型分析，试图利用地理信息系统软件来提供空间分析模块以及发展适用于问题解决模型的宏语言，这种方法一般基于空间分析的复杂性与多样性，易于理解和应用，但由于地理信息系统软件所能提供空间分析功能极为有限，这种紧密结合的空间模型分析方法在实际地理信息系统的设计中较少使用；第三类是混合型的空间模型分析，其宗旨在于尽可能地利用地理信息系统所提供的功能，同时也充分发挥地理信息系统使用者的能动性。

图形与交互显示同样是一项重要功能。地理信息系统为用户提供了许多用于地理数据表现的工具，其形式既可以是计算机屏幕显示，也可以是诸如报告、表格、地图等硬拷贝图件，尤其要强调的是地理信息系统的地图输出功能。一个好的地理信息系统应能提供一种良好的、交互式的制图环境，以供地理信息系统的使用者能够设计和制作出高质量的地图。

GIS基本理论之二：空间数据基本理论

1. 空间地理数据的基本特征

要完整地描述空间实体或现象的状态，一般需要同时有空间数据和属性数据。如果要描述空间实体或的变化，则还需记录空间实体或现象在某一个时间的状态。所以，一般认为空间数据具有三个基本特征：

⑴空间特征表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征，一般以坐标数据表示。

⑵属性特征表示现象的特征，例如变量、分类、数量特征和名称等等。

⑶时间特征指现象或物体随时间的变化。

位置数据和属性数据相对于时间来说，常常呈相互独立的变化，即在不同的时间，空间位置不变，但是属性类型可能已经发生变化，或者相反。因此，空间数据的管理是十分复杂的。

有效的空间数据管理要求位置数据和非位置数据互相作为单独的变量存放，并分别采用不同的软件来处理这两类数据。这种数据组织方法，对于随时间而变化的数据，具有更大的灵活性。

2. 如何在计算机内部用数字形式描述客观事物或现象

对地理信息进行数字化描述，就是要使计算机能够识别地理事物的形状，为此，必须精确地指出空间模式如何处理，如何显示等。在计算机内描述空间实体有两种形式：显式描述和隐式描述。在计算机中的显示表示，就是栅格中的一系列像元。隐式表示是由一系列定义了始点和终点的线及某种连接关系来描述。

计算机对地理实体的显式描述也称栅格数据结构，计算机对地理实体的隐式描述也称矢量数据结构。栅格和矢量结构是计算机描述空间实体的两种最基本的方式。

在栅格数据结构中，整个地理空间被规则地分为一个个小块（通常为正方形），地理实体的位置是由占据小块的横排与竖列的位置决定，小块的位置则由其横排竖列的数码决定，每个地理实体的形态是由栅格或网格中的一组点来构成。

在矢量数据结构中，地理实体的形状和位置是由一组坐标对所确定。矢量数据结构对地理实体的描述类似于地图对地理信息的描述，一般也把地理实体分为点、线、面三种，每种实体有不同的编码方法。

3. 栅格结构数据的特点有哪些，栅格数据有哪些获取手段

栅格结构的显著特点是：属性明显，定位隐含，即数据直接记录属性的指针或属性本身，而所在位置则根据行列号转换为相应的坐标，也就是说定位是根据数据在数据集中的位置得到的。由于栅格结构是按一定的规则排列的，所表示的实体的位置很容易隐含在格网文件的存储结构中，在后面讲述栅格结构编码时可以看到，每个存储单元的行列位置可以方便地根据其在文件中的记录位置得到，且行列坐标可以很容易地转为其他坐标系下的坐标。在格网文件中每个代码本身明确地代表了实体的属性或属性的编码，如果为属性的编码，则该编码可作为指向实体属性表的指针。由于栅格行列阵列容易为计算机存储、操作和显示，因此这种结构容易实现，算法简单，且易于扩充、修改，也很直观，特别是易于同遥感影像的结合处理，给地理空间数据处理带来了极大的方便。

栅格结构表示的地表是不连续的，是量化和近似离散的数据。在栅格结构中，地表被分成相互邻接、规则排列的矩形方块（特殊的情况下也可以是三角形或菱形、六边形等），每个地块与一个栅格单元相对应。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。在许多栅格数据处理时，常假设栅格所表示的量化表面是连续的，以便使用某些连续函数。由于栅格结构对地表的量化，在计算面积、长度、距离、形状等空间指标时，若栅格尺寸较大，则造成较大的误差，由于在一个栅格的地表范围内，可能存在多于一种的地物，而表示在相应的栅格结构中常常是一个代码。也类似于遥感影像的混合象元问题，如Landsat的MSS卫星影像单个象元对应地表79米*79米的矩形区域，影像上记录的光谱数据是每个象元所对应的地表区域内所有地物类型的光谱辐射的总和效果。因而，这种误差不仅有形态上的畸形，还可能包括属性方面的偏差。

栅格结构数据主要可由四个途径得到，即

①目读法：在专题图上均匀划分网格，逐个网格地决定其代码，最后形成栅格数字地图文件；

②数字化仪手扶或自动跟踪数字化地图，得到矢量结构数据后，再转换为栅格结构；

③扫描数字化：逐点扫描专题地图，将扫描数据重采样和再编码得到栅格数据文件；

④分类影像输入：将经过分类解译的遥感影像数据直接或重采样后输入系统，作为栅格数据结构的专题地图。

4. 栅格结构数据的编码与压缩有哪些方法，各自有何特点

在地理信息系统的空间数据结构中，栅格结构的编码方式主要有直接栅格编码、链码、游程长度编码、块码、四叉树码等。

直接栅格编码是最简单直观而又非常重要的一种栅格结构编码方法，通常称这种编码的图像文件为网格文件或栅格文件，栅格结构不论采用何种压缩编码方法，其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵，逐行（或逐列）逐个记录代码，可以每行都从左到右逐个象元记录，也可以奇数行地从左到右而偶数行地从右向左记录，为了特定目的还可采用其他特殊的顺序。

对压缩编码而言，目前有一系列栅格数据压缩编码的方法，如键码、游程长度编码、块码和四叉树编码等。其目的，就是用尽可能少的数据量记录尽可能多的信息，其类型又有信息无损编码和信息有损编码之分。信息无损编码是指编码过程中没有任何信息损失，通过解码操作可以完全恢复原来的信息，信息有损编码是指为了提高编码效率，最大限度地压缩数据，在压缩过程中损失一部分相对不太重要的信息，解码时这部分难以恢复。在地理信息系统中多采用信息无损编码，而对原始遥感影像进行压缩编码时，有时也采取有损压缩编码方法。

链码（Chain Codes）又称为弗里曼链码[Freeman]或边界链码，链码可以有效地压缩栅格数据，而且对于估算面积、长度、转折方向的凹凸度等运算十分方便，比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难，对局部的修改将改变整体结构，效率较低，而且由于链码以每个区域为单位存储边界，相邻区域的边界将被重复存储而产生冗余。

游程长度编码（Run-Length Codes）是栅格数据压缩的重要编码方法，它的基本思路是：对于一幅栅格图像，常常有行（或列）方向上相邻的若干点具有相同的属性代码，因而可采取某种方法压缩那些重复的记录内容。其方法有两种方案：一种编码方案是，只在各行（或列）数据的代码发生变化时依次记录该代码以及相同的代码重复的个数，从而实现数据的压缩。事实上，压缩比的大小是与图的复杂程度成反比的，在变化多的部分，游程数就多，变化少的部分游程数就少，图件越简单，压缩效率就越高。另一种游程长度编码方案就是逐个记录各行（或列）代码发生变化的位置和相应代码，游程长度编码在栅格压缩时，数据量没有明显增加，压缩效率较高，且易于检索，叠加合并等操作，运算简单，适用于机器存储容量小，数据需大量压缩，而又要避免复杂的编码解码运算增加处理和操作时间的情况。

块码是游程长度编码扩展到二维的情况，采用方形区域作为记录单元，每个记录单元包括相邻的若干栅格，数据结构由初始位置（行、列号）和半径，再加上记录单位的代码组成。

四叉树又称四元树或四分树，是最有效的栅格数据压缩编码方法之一，绝大部分图形操作和运算都可以直接在四叉树结构上实现，因此四叉树编码既压缩了数据量，又可大大提高图形操作的效率。四叉树将整个图像区逐步分解为一系列被单一类型区域内含的方形区域，最小的方形区域为一个栅格象元，分割的原则是，将图像区域划分为四个大小相同的象限，而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限，其终止判据是，不管是哪一层上的象限，只要划分到仅代表一种地物或符合既定要求的少数几种地物时，则不再继续划分，否则一直划分到单个栅格象元为止。四叉树通过树状结构记录这种划分，并通过这种四叉树状结构实现查询、修改、量算等操作。四叉树编码具有可变的分辨率，并且有区域性质，压缩数据灵活，许多运算可以在编码数据上直接实现，大大地提高了运算效率，是优秀的栅格压缩编码之一。

5. 矢量结构数据的特点有哪些，矢量数据的获取手段有哪些

矢量结构的特点是：定位明显、属性隐含，其定位是根据坐标直接存储的，而属性则一般存于文件头或数据结构中某些特定的位置上，这种特点使得其图形运算的算法总体上比栅格数据结构复杂的多，有些甚至难以实现，当然有些地方也有所便利和独到之处，在计算长度、面积、形状和图形编辑、几何变换操作中，矢量结构有很高的效率和精度，而在叠加运算、邻域搜索等操作时则比较困难。

矢量数据的获取手段是数字化仪手扶或自动跟踪数字化地图。

6. 什么是拓扑结构，拓扑结构包含哪些内容

在GIS中，为了真实地反映地理实体，不仅要包括实体的位置、形状、大小和属性、还必须反映实体之间的相互关系。这些关系就是指它们之间的邻接关系，关联关系和包含关系。

点、线、面基本数据之间的关系，代表了空间实体之间的位置关系。分析点、线、面三种类型的数据，得出其可能存在的空间关系有以下几种：

点—点关系

点和点之间的关系主要有两点（通过某条线）是否相连，两点之间的距离是多少？如城市中某两个点之间可否有通路，距离是多少？这是在实际生活中常见的点和点之间的空间关系问题。

点—线关系

点和线的关系主要表现在点和线的关联关系上。如点是否位于线上，点和线之间的距离等等。

点—面关系

点和面的关系主要表现在空间包含关系上。如某个村子是否位于某个县内？或某个县共有多少个村子？

线—线关系

线和线是否邻接、相交是线和线关系的主要表现形式。如河流和铁路的相交，两条公路是否通过某个点邻接？

线—面关系

线和面的关系表现为线是否通过面或和面关联或包含在面之内？

面—面关系

面和面之间的关系主要表现为邻接和包含的关系。

7. 选择栅格或矢量结构数据的考虑因素有哪些，如何选择恰当的数据结构

栅格结构和矢量结构是模拟地理信息的两种不同的方法。栅格数据结构类型具有“属性明显、位置隐含”的特点，它易于实现，且操作简单，有利于基于栅格的空间信息模型的分析，如在给定区域内计算多边形面积、线密度，栅格结构可以很快算得结果，而采用矢量数据结构则麻烦的多；但栅格数据表达精度不高，数据存储量大，工作效率较低。如要提高一倍的表达精度（栅格单元减小一半），数据量就需增加三倍，同时也增加了数据的冗余。因此，对于基于栅格数据结构的应用来说，需要根据应用项目的自身特点及其精度要求来恰当地平衡栅格数据的表达精度和工作效率两者之间的关系。另外，因为栅格数据格式的简单性（不经过压缩编码），其数据格式容易为大多数程序设计人员和用户所理解，基于栅格数据基础之上的信息共享也较矢量数据容易。

8. GIS对空间数据是如何组织和管理的，空间数据分层的原则是什么

依据地理实体之间不同的特征、相似的特征以及不同地理实体的组合特征对地理特征进行分类；通过分类，按专题来理解和描述现实世界的复杂关系，来实现数据编码，实现空间数据的组织。

地理空间上按图幅来组织和管理。

同一图幅内按图层来组织和管理，即图层来组织和管理空间数据。

图层内按类型和目标来组织和管理。

空间数据分层的方法包括三种，即按专题分层、按时间序列分层和以地面垂直高度分层

9. 试分析GIS数据的误差来源及种类

从空间数据的形式表达到空间数据的生成，从空间数据的处理变换到空间数据的应用，在这两个过程中都会有数据质量问题的发生。下面按照空间数据自身存在的规律性，从几个方面来阐述GIS数据误差的来源。

空间数据质量问题首先来源于空间现象自身存在的不稳定性。空间现象自身存在的不稳定性包括空间特征和过程在空间、专题和时间内容上的不确定性。空间现象在空间上的不确定性指其在空间位置分布上的不确定性变化；空间现象在时间上的不确定性表现为其在发生时间段上的游移性；空间现象在属性上的不确定性表现为属性类型划分的多样性，非数值型属性值表达的不精确性。因此，空间数据存在质量问题是不可避免的。

其次，数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响，这对于数据的生成会出现误差。如在地图投影中，由椭球体到平面的投影转换必然产生误差；用于获取各种原始数据的各种测量仪器都有一定的设计精度，如GPS提供的地理位置数据都有用户要求的一定设计精度，因而数据误差的产生不可避免。

第三，在空间数据处理过程中，容易产生的误差有以下几种：（1）投影变换：地图投影是开口的三维地球椭球面到二维场平面的拓扑变换。在不同投影形式下，地理特征的位置、面积和方向的表现会有差异。（2）地图数字化和扫描后的矢量化处理：数字化过程采点的位置精度、空间分辨率、属性赋值等都可能出现误差。（3）数据格式转换：在矢量格式和栅格格式之间的数据格式转换中，数据所表达的空间特征的位置具有差异性。（4）数据抽象：在数据发生比例尺变换时，对数据进行的聚类、归并、合并等操作时产生的误差，如知识性误差和数据所表达的空间特征位置的变化误差。（5）建立拓扑关系：拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化。（6）与主控数据层的匹配：一个数据库中，常存储同一地区的多层数据面，为保证各数据层之间空间位置的协调性，一般建立一个主控数据层以控制其它数据层的边界和控制点。在与主控数据层匹配的过程中也会存在空间位移，导致误差。（7）数据叠加操作和更新：数据在进行叠加运算以及数据更新时，会产生空间位置和属性值的差异。（8）数据集成处理：指在来源不同、类型不同的各种数据集的相互操作过程中所产生的误差。数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程，其中位置误差、属性误差都会出现。（9）数据的可视化表达：数据在可视化表达过程中为适应视觉效果，需对数据的空间特征位置、注记等进行调整，由此产生数据表达上的误差。（10）数据处理过程中误差的传递和扩散：在数据处理的各个过程中，误差是累计和扩散的，前一过程的累计误差可能成为下一个阶段的误差起源，从而导致新的误差的产生。

第四，在空间数据使用的过程中也会导致误差的出现，主要包括两个方面：一是对数据的解释过程，二是缺少文档。对于同一种空间数据来说，不同用户对它的内容的解释和理解可能不同，处理这类问题的方法是随空间数据提供各种相关的文档说明，如元数据。另外，缺少对某一地区不同来源的空间数据的说明，如缺少投影类型、数据定义等描述信息，这样往往导致数据用户对数据的随意性使用而使误差扩散。

误差的类型包括以下几种：

第一是逻辑误差。事实上检查逻辑误差，有助于发现不完整的数据。对数据进行质量控制或质量保证或质量评价，一般先从数据的逻辑性检查入手。例如，对一幅包含有桥或停车场等与道路是相接的情况时，如果数据库中只有桥或停车场，而没有与道路相连，则说明道路数据被遗漏，使数据不完整。

第二是几何误差。由于地图是以二维平面坐标表达位置，在二维平面上的几何误差主要反映在点和线上。

（1）点误差

关于某点的点误差即为测量位置（x，y）与其真实位置（x0，y0）的差异。真实位置的测量方法比测量位置的要更加精确，如在野外使用高精度的GPS方法得到。点误差可通过计算坐标误差和距离的方法得到。坐标误差定义为：Δx=x-x0 ，Δy=y-y0

为了衡量整个数据采集区域或制图区域内的点误差，一般抽样测算（Δx,Δy）。抽样点应随机分布于数据采集区内，并具有代表性。这样抽样点越多，所测的误差分布就越接近于点误差的真实分布。

（2）线误差

线在地理信息系统数据库中既可表示线性现象，又可以通过连成的多边形表示面状现象。第一类是线上的点在真实世界中是可以找到的，如道路、河流、行政界线等，这类的线性特征的误差主要产生于测量和对数据的后处理；第二类是现实世界中找不到的，如按数学投影定义的经纬线、按高程绘制的等高线，或者是气候区划线和土壤类型界限等，这类线性特征的线误差及在确定线的界限时的误差，被称为解译误差。解译误差与属性误差直接相关，若没有属性误差，则可以认为那些类型界线是准确的，因而解译误差为零。

10. 什么是元数据，引入元数据的目的是什么

在地理空间数据中，元数据是说明数据内容、质量、状况和其他有关特征的背景信息。

元数据是关于数据的描述性数据信息，它应尽可能多地反映数据集自身的特征规律，以便于用户对数据集的准确、高效与充分的开发与利用，不同领域的数据库，其元数据的内容会有很大差异。通过元数据可以检索、访问数据库，可以有效利用计算机的系统资源，可以对数据进行加工处理和二次开发等。

在地理信息系统应用中，元数据的主要作用可以归纳为如下几个方面：

第一，帮助数据生产单位有效地管理和维护空间数据、建立数据文档，并保证即使其主要工作人员离退时，也不会失去对数据情况的了解；

第二，提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息，便于用户查询检索地理空间数据；

第三，帮助用户了解数据，以便就数据是否能满足其需求做出正确的判断；

第四，提供有关信息，以便用户处理和转换有用的数据。

可见，元数据是使数据充分发挥作用的重要条件之一，它可以用于许多方面，包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。

GIS基本理论之三：空间数据处理理论与空间数据库

1. 空间信息处理的内容有哪些

在图形数据录入完毕后，需要进行各种处理，空间信息处理包括以下内容：

第一，图形坐标变换。

在地图录入完毕后，经常需要进行投影变换，得到经纬度参照系下的地图。对各种投影进行坐标变换的原因主要是输入时地图是一种投影，而输出的地图产物是另外一种投影。进行投影变换有两种方式，一种是利用多项式拟合，类似于图像几何纠正；另一种是直接应用投影变换公式进行变换。

第二是，是图形拼接。

在对底图进行数字化以后，由于图幅比较大或者使用小型数字化仪时，难以将研究区域的底图以整幅的形式来完成，这是需要将整个图幅划分成几部分分别输入。在所有部分都输入完毕并进行拼接时，常常会有边界不一致的情况，需要进行边缘匹配处理（图6-13）。边缘匹配处理，类似于下面提及的悬挂节点处理，可以由计算机自动完成，或者辅助以手工半自动完成。

第三，是拓扑生成。

在图形数字化——无论是手扶跟踪数字化还是扫描矢量化——完成后，对于大多数地图需要建立拓扑，以正确判别地物之间的拓扑关系。这又包括两部分，一是图形修改，即在建立拓扑关系的过程中，一些在数字化输入过程中的错误需要被改正，否则，建立的拓扑关系将不能正确地反映地物之间的关系，二是建立拓扑关系，即在图形修改完毕之后，就意味着可以建立正确的拓扑关系，拓扑关系可以由计算机自动生成，目前大多数GIS软件也都提供了完善的拓扑功能；但是在某些情况下，需要对计算机创建的拓扑关系进行手工修改，典型的例子是网络连通性。

2. 空间坐标变换都有哪些类型和方法

空间坐标变换包括矢量转换和栅格转换。

首先是矢量转换，有三种方式：

第一是表格坐标(u, v)转换为原地图投影坐标(x, y)，是平面坐标到平面坐标的转换。（1）对应关系明确、已知的，按相应关系式计算，如旋转变换的公式为：

X1 = x * cosa - y * sina

Y1 = x * sina + y * cosa

（2）对应关系不明确、未知的，可通过拟合对应关系式来实现，如采用二元多项式拟合两种坐标之间的转换关系式：

x = a0+ a1*u+ a2*v+a3*u2 + a4*u*v+ a5*v2

y = b0+ b1*u+ b2*v+b3*u2 + b4*u*v+ b5*v2

第二是投影坐标到地理坐标的转换。将原地图的投影坐标(x, y)从平面坐标转换为用经纬度表示的地理坐标。是地图投影的逆变换，与投影类型和椭球体有关。要求提供投影参数。

第三是地理坐标到工作投影坐标的转换。将用经纬度表示的地理坐标转换为工作投影坐标(x’, y’) 坐标(平面坐标)。

其次是栅格转换。包括栅格单元（像素）空间重建和属性值重建两步。

第一是空间坐标的转换，分两种情况转换（重建）。若输入栅格数据的地理投影类型已知，使用正转换方程；若输入栅格数据的地理投影类型未知（未经过地学编码），使用适合地面控制点的高阶多项式进行拟合。

第二是栅格单元（像素）属性值重新确定（重采样）。在新的栅格中像素值根据一个或更多相邻像素值确定。常用方法有：最近邻法、线性内插法和三次卷积法。

3. 如何实现栅格数据和矢量数据的空间对应

可以通过GCP，建立栅格单元与地理坐标之间的对应关系。

具体处理步骤：选取并打开栅格图象；定义地理坐标（设置投影参数）；选取GCP；设定校正区域（通常是整个图像），计算对应关系；执行校正，生成含地理信息新图像，保存对应关系。

下面谈谈栅格数据与矢量数据的相互转换。

矢量结构与网格结构的相互转换，是地理信息系统的基本功能之一，目前已经发展了许多高效的转换算法；但是，从栅格数据到矢量数据的转换，特别是扫描图像的自动识别，仍然是目前研究的重点。

对于点状实体，每个实体仅由一个坐标对表示，其矢量结构和栅格结构的相互转换基本上只是坐标精度变换问题，不存在太大的技术问题。线实体的矢量结构由一系列坐标对表示，在变为栅格结构时，除把序列中坐标对变为栅格行列坐标外，还需根据栅格精度要求，在坐标点之间插满一系列栅格点，这也容易由两点式直线方程得到。线实体由栅格结构变为矢量结构与将多边形边界表示为矢量结构相似，因此需要重点讨论多边形（面实体）的矢量结构与栅格结构相互转换。

4. 地图、空间信息分析和地理信息系统三者的关系

地理信息系统可以称为“动态的地图”，它提供了比普通地图更为丰富和灵活的空间数据表现方式，如动态信息表达、虚拟现实等等。但是，从另外的角度来看，制图学又是一门艺术，单纯依靠计算机系统是难以制作完美的地图的，它需要人工的交互干预，如制图综合。

可以说，地图是客观世界的形象——符号——概括模型。首先，地图是客观世界的形象模型，地图与其它地学模型的主要区别和优点在于它具有形象性，能对实际对象做出完整的、清晰的和直观的图形描述和说明。“地图是地表空间关系和空间形式的视觉图解表象”。其次，地图是客观世界的符号模型。地图区别于其它许多图示模型的又一特征是它采用专门设计和事先规定的符号来反映地物、现象和地理过程，并表示它们的位置、质量特征和数量特征。各种符号的组合便构成一种地图形象，而多种地图形象的汇集便组成一幅完整的地图图形。地图符号的作用并不仅仅局限于传输信息，它们还是记录知识、使知识定型并系统化的强大工具。第三，地图是客观世界的概括模型。地图不是客观对象的完全再现，而是通过地图制图工作者脑和手的“过滤”、概括和抽象出来的模型。对地物进行取舍、图形化简、数量和质量概括、地物协调，以及夸大表示等处理，是地图学者对地物进行深刻理解、综合分析并抽象概括等一系列复杂的科学思维和创造性劳动的结果。因此，对制图对象进行地图概括是地图作为客观实际模型的一个最重要的特征。

5. 空间数据的输入包括哪些内容，输入方法有哪几种

空间数据获取是地理信息系统建设首先要进行的任务，它可以有多种实现方式包括数据转换、遥感数据处理以及数字测量等等，其中已有地图的数字化录入，是目前被广泛采用的手段，也是最耗费人力资源的工作。在GIS中，录入的内容包括空间信息和非空间信息，前者是录入的主体。目前，空间信息的录入主要有两种方式，即手扶跟踪数字化和扫描矢量化。

所谓的地图数字化就是当纸地图经过计算机图形图像系统光——电转换量化为点阵数字图像，经图像处理和曲线矢量化，或者直接进行手扶跟踪数字化后，生成可以为地理信息系统显示、修改、标注、漫游、计算、管理和打印的矢量地图数据文件，这种与纸地图相对应的计算机数据文件称为矢量化电子地图。这种地图工作时需要有应用软件和硬件系统的支撑。对矢量化地图的操作是以人机交互方式，通过GIS应用软件对硬件设备的控制来实现的。

第一是手扶跟踪数字化。尽管手扶跟踪数字化（Manual Digitising）工作量非常繁重，但是它仍然是目前最为广泛采用的将已有地图数字化的手段。利用手扶跟踪数字化仪可以输入点地物、线地物以及多边形边界的坐标。其具体的输入方式与地理信息系统软件的实现有关，另外一些GIS系统也支持用数字化仪输入非空间信息，如等高线的高度，地物的编码数值等等。

第二是扫描矢量化以及处理流程。随着计算机软件和硬件更加便宜，并且提供了更多的功能，空间数据获取成本成为GIS项目中最主要的成分。由于手扶跟踪数字化需要大量的人工操作，使得它成为以数字为主体的应用项目瓶颈。扫描技术的出现无疑为空间数据录入提供了有力的工具。由于扫描仪扫描幅面一般小于地图幅面，因此大的纸地图需先分块扫描，然后进行相邻图对接；当显示终端分辨率及内存有限时，拼接后的数字地图还要裁剪成若干个归一化矩形块，对每个矩形块进行矢量化处理后生成便于编辑处理的矢量地图，最后把这些矢量化的矩形图块合成为一个完整的矢量电子地图，并进行修改、标注、计算和漫游等编辑处理。

6. 空间数据的编辑包括哪些内容

空间数据的编辑包括以下内容：

第一是误差或错误的检查与编辑。

图形和属性数据的误差主要有：空间数据的不完整或重复，包括点、线、面数据的丢失或重复，多边形中心点的遗漏，数据断线、多边形不封闭等；空间数据位置不准确，点位不准确，线段过长或过短，结点不重合；比例尺不准确；数据变形；属性与空间数据连接错误；属性不完整。检查方法有叠合比较、目视检查、逻辑检查。

第二是图形图象的纠正。包括仿射变换、相似变换、透视变换。

第三是坐标系统变换。包括设备坐标到真实世界坐标变换、地图投影变换。

第四是数据格式变换。包括数据介质不同的转换，矢栅转换；数据结构不同的转换，不同系统之间数据文件的转换。

第五是图形编辑。包括结点吻合、结点与线的吻合、清楚假结点、删除与增加角点、移动角点、删除与增加弧段、数据清理、更新数据。

第六是剪裁、拼接与合并。剪裁是通过剪裁巨型或多边形进行。拼接包括几何接边、逻辑接边。合并包括图形合并、图幅合并（逻辑无缝合并，物理无缝合并）。

7. 地理信息的输出技术有哪些，GIS产品有哪些

空间数据的输出，即GIS产品，是指由系统处理、分析后，可以直接提供给决策部门使用的产品，是地理空间数据的表现形式。主要是GIS对空间数据库进行检索、对相关数据进行处理和分析的结果、结论。

目前输出地图的方式包括笔式绘图仪或栅格式彩色绘图仪输出纸质彩色地图、高分辨率彩色屏幕输出电子地图以及影像曝光仪（印前处理系统）输出分色加网胶片。

产品形式包括：地图，即各种各样的专题地图；图像，即影像地图（专题地图+背景图）；统计图表和文字报告；一些数字产品。同时，随着多媒体、网络、虚拟现实模型语言(VRML)等计算机新技术的发展，产品形式更具多样花，如网络地图、多媒体地图等。

具体而言，包括以下内容：

第一，全要素地形图。其内容包括水系、地貌、植被、居民地、交通、境界、独立地物等。它们具有统一的大地控制、统一的地图投影和分幅编号，统一的比例尺系统（1:5000、1:1万、1:2.5万、1:5万、1:10万、1:25万、1:50万、1:100万），统一的编制规范和图式符号，属于国家基本比例尺地形图。它们是编制各类专题地图的基础。

第二是专题图。它是突出表示一种或几种自然或社会经济现象的地图。它主要由地理基础和专题内容两部分组成。从专题图内容或要素的显示特征来看，一般包括空间分布、时间变异以及数量、质量特征三个方面。专题图按照空间分布的点状、线状和面状分布大致有以下的一些表示方法：定点符号法、线状符号法、质别底色法、等值线法、定位图表法、范围法、点值法分级比值法、分区图表法和动线法等

第三是遥感影像地图。随着遥感技术的发展，遥感影像地图已成为地理信息系统产品的一种表达形式。遥感可以提供及时、准确、综合和大范围的各种资源与环境数据，成为地理信息系统重要数据数据源之一。同时，在将遥感图像进行纠正的基础上，按照一定的数学法则，运用特定的地图符号，结合表示地面特征的地图，可以将遥感图像编制成遥感影像地图。遥感影像地图具有遥感图像和地形图的双重优点。既包含了遥感图像的丰富信息内容，又保证了地形图的整饰和几何精度。遥感影像地图按其内容又可分为普通影像地图和专题影像地图。两者的主要区别在于：前者表示包括等高线等地形内容要素，后者主要反映专题内容。

第四是统计图表、数据报表。在地理信息系统中，属性数据大约占数据量的80%左右。它们是以关系（表）的形式存在的，反映了地理对象的特征、性质等属性。属性数据的表示方法可以采用前面所列的专题图的形式，同时还可以直接用统计图表和数据报表的形式加以直观表示。

第五是数字地图。地理信息系统的完善和发展，改变了人们对传统地图的认识以及地图的生产工艺，同时也出现了一种崭新的地图形式——数字地图，即电子地图：以地图数据库为基础，以数字形式记录和存储于计算机内，可在电子屏幕上实时显示的可视地图。

8. 地理对象可视化的技术和内容

空间数据的图形显示和表达是GIS的重要功能之一。初期阶段主要是对颜色的配置、多边形填充等，随着相关技术进步，空间数据的图形表达也从二维静态的图形显示发展到动态的交互的三维可视化及虚拟现实技术。

地理空间可视化是把获取的各种地理空间数据，经空间可视化模型的计算分析，转换成可被人的视觉感知的计算机二维或三维图形图像，并可对生成的影像进行二维或三维的空间查询或地学模型的计算分析。地理空间可视化包括地理空间二绍可视化和地理空间三维可视化。地理空间二维可视化，二维到二维的映射，只需把地理大地坐标系与屏坐标系相对应即可。地理空间三维可视化，三维到二维的映射，需要一系列图形学处理技术。

其类型包括地图可视化、GIS可视化、专业应用领域可视化。

地图可视化类型包括：

（1）虚拟地图，在计算机屏幕上产生的地图。

（2）动态地图，由于地学数据存储于计算机内存，可以动态显示地学数据的不同角度的观察，不同方法的表示结果，或者随时间的变化结果。

（3）交互交融地图，是指人可与地图进行相互作用和信息交流。交互即相互改变显示行为，交融即投入感和沉浸感。

（4）超地图，多媒体地图。是与超文本概念对应的。

GIS可视化主要指真三维的可视化、2.5维、动态可视化等。

专业可视化是指专业应用领域的计算、模拟和结果在GIS支持下的可视化显示。

9. 空间数据库的管理模式有哪些

空间数据库是一种应用于地理空间数据处理与信息分析领域的具有工程性质的数据库，它所管理的对象主要是地理空间数据(包括空间数据和非空间数据)。大多数商品化的GIS软件都不是采取传统的某一种单一的数据模型，也不是抛弃传统的数据模型，而是采用建立在关系数据库管理系统(RDBMS)基础上的综合的数据模型，归纳起来，主要有以下三种：

⑴ 混合结构模型（Hybrid Model）

它的基本思想是用两个子系统分别存储和检索空间数据与属性数据，其中属性数据存储在常规的RDBMS中，几何数据存储在空间数据管理系统中，两个子系统之间使用一种标识符联系起来

由于这种混合结构模型的一部分是建立在标准RDBMS之上，故存储和检索数据比较有效、可靠。但因为使用两个存储子系统，它们有各自的规则，查询操作难以优化，存储在RDBMS外面的数据有时会丢失数据项的语义；此外，数据完整性的约束条件有可能遭破坏。

⑵扩展结构模型（Extended Model）

混合结构模型的缺陷是因为两个存储子系统具有各自的职责，互相很难保证数据存储、操作的统一。扩展结构模型采用同一DBMS存储空间数据和属性数据。其做法是在标准的关系数据库上增加空间数据管理层，即利用该层将地理结构查询语言(GeoSQL)转化成标准的SQL查询，借助索引数据的辅助关系实施空间索引操作。这种模型的优点是省去了空间数据库和属性数据库之间的繁琐联结，空间数据存取速度较快，但由于是间接存取，在效率上总是低于DBMS中所用的直接操作过程，且查询过程复杂。

⑶统一模数据型（Integrated Model）

这种综合数据模型不是基于标准的RDBMS，而是在开放型DBMS基础上扩充空间数据表达功能。空间扩展完全包含在DBMS中，用户可以使用自己的基本抽象数据类型(ADT)来扩充DBMS。在核心DBMS中进行数据类型的直接操作很方便、有效，并且用户还可以开发自己的空间存取算法。该模型的缺点是，用户必须在DBMS环境中实施自己的数据类型，对有些应用将相当复杂。

10. 面向对象的数据模型有哪些优点

面向对象方法基本出发点就是尽可能按照人类认识世界的方法和思维方式来分析和解决问题。客观世界是由许多具体的事物或事件、抽象的概念、规则等组成的。因此，我们将任何感兴趣或要加以研究的事物概念都统称为“对象”(或称目标)。面向对象的方法正是以对象作为最基本的元素，它也是分析问题，解决问题的核心。OO方法很自然地符合人的认识规律。计算机实现的对象与真实世界具有一对一的对应关系，不需作任何转换，这样就使OO方法更易于为人们所理解、接受和掌握。面向对象方法具有的模块化，信息封装与隐藏、抽象性、多形性等独特之处,为解决大型软件管理，提高软件可靠性、可重用性、可扩充性和可维护性提供了有效的手段和途径，很快被引入到所有与计算机科学有关的领域。

GIS基本理论之四：空间数据分析基本理论

1. 空间信息分析的内容包括哪些操作？有哪些功能？

空间信息分析通常是指GIS为用户提供的解决问题的方法。

空间信息分析的基本方法包括以下一些内容：

（1）空间信息量算：质心计算、几何量算、形态量算等

（2）空间信息分类：主成分分析(PCA)、层次分析(AHP) 、聚类分析、判别分析等

（3）叠加分析：视觉信息复合；属性层叠合

（4）网络分析：路径分析、地址匹配、资源分配、空间规划等

（5）邻域(近)分析：缓冲区、泰森多边形、等值线、扩散等

（6）空间统计分析：常规统计、空间自相关、回归、趋势分析、专家打分（加权）等

（7）数据的插值：点的内插

下面分别描述：

空间数据的查询检索是GIS最基本的功能。用户可通过它，不仅能提取数据库中的既有信息，还能进一步获取很多派生的空间信息。空间数据查询检索：按一定的要求对GIS所描述的空间实体及其空间信息进行访问，检索出满足用户要求的空间实体及其相应的属性，并形成新的数据子集。

空间数据的多元复合、空间属性的多层叠加，是基于同一空间位置、区域，进行属性运算。GIS最主要的分析功能。空间数据叠合是以空间层次分析理论为基础，空间信息复合包括视觉信息复合(只是显示，不生成新数据层，较简单)和属性数据层叠合(生成新的数据层，复杂)。

空间数据分类和统计分析的目的是简化复杂的事物，突出主要因素。空间数据分类包括单因素分类，即属性变量区间、组合；间接因素；地理区域；多因素分类，即主成分分析；聚类分析。多变量统计分析主要用于数据分类和综合评价。数据分类是GIS重要组成部分；综合评价是区划和规划的基础。常用统计分析方法包括：

（1）常规统计分析：主要完成对数据集合的均值、总和、方差、频数、峰度系数等参数的统计分析。如：数学期望值、中数、众数；极差、离差、标准差、变差系数等。

（2）空间自相关分析：空间自相关分析是认识空间分布特征、选择适宜的空间尺度来完成空间分析的最常用的方法。

（3）回归分析：用于分析两组或多组变量之间的相关关系。有多种回归拟合，如线性回归、指数回归、对数回归、多元回归等

（4）趋势分析：通过数学模型模拟地理特征的空间分布与时间过程，把地理要素时空分布的实测数据点之间的不足部分内插或预测出来

（5）主组（成）分分析：亦称K-L变换，用作变量重组和筛选。地理问题往往涉及大量相互关联的自然和社会要素，众多的要素常常给分析带来很大困难，同时也增加了运算的复杂性。主成分分析法通过数理统计分析，将众多要素的信息压缩表达为若干具有代表性的合成变量，这就克服了变量选择时的冗余和相关，然后选择信息最丰富的少数因子进行各种聚类分析。

（6）层次分析。在分析涉及大量相互关联、相互制约的复杂因素时，各因素对问题的分析有着不同程度的重要性，决定它们对目标的重要性序列对问题的分析十分重要。AHP方法把相互关联的要素按隶属关系划分为若干层次，请有经验的专家们对各层次各因素的相对重要性给出定量指标（专家打分），利用数学方法，综合众人意见给出各层次各要素的相对重要性权值，作为综合分析的基础。

（7）聚类分析系统聚类是根据多种地学要素对地理实体划分类别的方法。对不同的要素划分类别往往反映不同目标的等级序列，如土地分等定级、水土流失强度分级等。

系统聚类根据实体间的相似程度，逐步合并为若干类别，其相似程度由距离或相似系数定义，主要有欧氏距离、绝对值距离、马氏距离等、切比雪夫距离。

（8）判别分析。判别分析与聚类分析同属分类问题，所不同的是，判别分析是根据理论与实践，预先确定出等级序列的因子标准，再将分析的地理实体安排到序列的合理位置上。对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统的定级问题比较适用。

网络分析的具体门类、对象、要求变化非常多。一般GIS只提供一些常用的分析方法，或提供、描述网络的数据模型，储存信息的数据库。

邻近分析是通过空间点周围的邻点，或某特定位置及方向范围内的某种性质的邻点，对其进行分析的一种方法。该方法涉及数据及其邻点之间相互关系。

2. 如何实现图形信息与属性信息的互动查询

由图（空间位置）查（检索）文（属性）：大多数商品化GIS软件的查询功能都可完美地实现对空间实体的简单查找，如根据鼠标所指的空间位置，查找出该处的空间实体和空间范围(由若干个空间实体组成)以及它们的属性，并显示出该空间对象的属性列表，并可进行有关统计分析。

查询工作分两步：首先借助于空间索引，在空间数据库中快速检索出被选空间实体；然后，根据空间数据和属性数据的连接即可得到该空间实体的属性列表。

由文（属性）查（检索）图（空间位置、分布）：属性条件查询用户可以在图形中找出符合一定属性条件的空间对象，被选中的对象区域可以在原视图中高亮显示。

基于属性信息的查询操作主要是在属性数据库中完成的。大多数GIS软件都将属性信息存储在RDB中，而RDB又为我们提供了完备的数据索引方法及信息查询手段。几乎所有的关系数据库管理系统都支持标准 SQL。

3. 图形空间的叠合分析包括哪些内容

空间数据的多元复合、空间属性的多层叠加，是基于同一空间位置、区域，进行属性运算。GIS最主要的分析功能。

空间数据叠合是以空间层次分析理论为基础。

空间信息复合包括视觉信息复合(只是显示，不生成新数据层，较简单)和属性数据层叠合(生成新的数据层，复杂)。

第一，视觉信息复合。将同一地区的同一比例尺的不同含义的图像、地图进行叠合，从而获得更多的空间信息或改善视觉效果，以便用户直观地判断不同地理实体的空间关系。GIS中视觉复合通常有3类：

（1）点、线和面状图之间的复合：通过点、线、面状图的复合，寻求特征信息在空间上的关联性。

（2）专题图与数字高程图复合成立体专题图：主要是改善视觉效果。

（3）遥感信息与专题图复合：影像地图再有IHS变换增强视觉效果、多元信息复合，地图可视化。

视觉复合只是改善了视觉效果，各属性层数据结构不变，也不生成新数据

第二，属性数据层叠合。将分散在不同层上的空间、属性信息按相同空间位置重叠在一起，进行图形运算和属性运算（关系运算），产生新的空间图形和属性（数据层）的过程。不仅产生视觉效果，更主要是形成新目标，其属性包含了参加叠合的多种属性，重新划分了数据的空间区域。叠合分析的目的是寻找和确定同时具有几种地理属性的地理要素的分析，或按照确定的地理指标，对叠合结果数据进行重新分类分级

4. 网络分析的内容包括哪些，影响因素有哪几种

网络分析的主要用途是：选择最佳路径；选择最佳布局中心的位置。所谓最佳路径是指从始点到终点的最短距离或花费最少的路线；最佳布局中心位置是指各中心所覆盖范围内任一点到中心的距离最近或花费最小；网流量是指网络上从起点到终点的某个函数，如运输价格，运输时间等。网络上任意点都可以是起点或终点。其基本思想则在于人类活动总是趋向于按一定目标选择达到最佳效果的空间位置。这类问题在生产、社会、经济活动中不胜枚举，因此研究此类问题具有重大意义。

网络分析的基本方法有：

(1) 路径分析

①静态求最佳路径：由用户确定权值关系后，即给定每条弧段的属性，当需求最佳路径时，读出路径的相关属性，求最佳路径。

②动态分段技术：给定一条路径由多段联系组成，要求标注出这条路上的公里点或要求定位某一公路上的某一点，标注出某条路上从某一公里数到另一公里数的路段。

③N条最佳路径分析：确定起点、终点，求代价较小的几条路径，因为在实践中往往仅求出最佳路径并不能满足要求，可能因为某种因素不走最佳路径，而走近似最佳路径。

④最短路径：确定起点、终点和所要经过的中间点、中间连线，求最短路径。

⑤动态最佳路径分析：实际网络分析中权值是随着权值关系式变化的，而且可能会临时出现一些障碍点，所以往往需要动态地计算最佳路径。

(2) 地址匹配

地址匹配实质是对地理位置的查询，它涉及到地址的编码。地址匹配与其它网络分析功能结合起来，可以满足实际工作中非常复杂的分析要求。所需输入的数据，包括地址表和含地址范围的街道网络及待查询地址的属性值。

(3)资源分配

资源分配网络模型由中心点(分配中心)及其状态属性和网络组成。分配有两种方式，一种是由分配中心向四周输出，另一种是由四周向中心集中。这种分配功能可以解决资源的有效流动和合理分配。其在地理网络中的应用与区位论中的中心地理论类似。在资源分配模型中，研究区可以是机能区，根据网络流的阻力等来研究中心的吸引区，为网络中的每一连接寻找最近的中心，以实现最佳的服务。还可以用来指定可能的区域。

资源分配模型可用来计算中心地的等时区、等交通距离区、等费用距离区等。可用来进行城镇中心、商业中心或港口等地的吸引范围分析，以用来寻找区域中最近的商业中心，进行各种区划和港口腹地的模拟等。

5. 缓冲区分析包括哪些内容，三种类型的缓冲区是如何建立的

缓冲区又称影响区或影响带，是指围绕地理要素的一定宽度的区域。缓冲区分析是用来确定不同地理要素的空间邻近性和接近程度的一类重要的空间操作。当考察发生在地理要素及其附近的活动的影响范围时，需要围绕地理要素生成缓冲区，进行缓冲区分析。如分析商场的市场区位、道路沿线的地价变化等。

点、线、面（区域）及多重缓冲区的算法原理：

（1）点的缓冲区生成：以点为圆心，以一定距离为半径画圆。

（2）线的缓冲区生成：分别对每一个顶点和每条边生成缓冲区，然后对这些缓冲区多边形进行叠合操作。

（3）面的缓冲区生成：首先生成多边形周长的缓冲区(线缓冲区)，然后与原始多边形进行叠合操作。多边形缓冲区有内外侧之分。

（4）多重缓冲区生成：以不同的半径首先分别生成一定宽度的缓冲区，然后对不同半径的缓冲取进行叠合操作。

6. 什么是DTM，什么是DEM，二者有什么差别

数字地形模型(DTM，Digital Terrain Model)是通过地表点集的空间坐标(x,y,z)及其属性数据表示地形表面特征的地学模型。在GIS中，DTM广泛地应用于各种线路、水利工程的选择、军事地形分析、土壤分析等。

DTM作为空间数据库的一种特定结构的数据集合，可以包括在GIS中，成为其核心部分。DTM提出的早，可以认为DTM是GIS在概念上和方法上的萌芽。DTM是描述地表单元空间位置和地形属性分布的有序集合。是定义于二维区域上的一个有限项的向量系列。它以离散分布的平面点来模拟连点分布的地形。

由于DTM是地理空间定位的数字数据集合，凡涉及地理空间的地学领域中各种属性，如地价、土地权属、土壤类型、地貌特征、岩层深度及土地利用等与地形有关的信息，均可用DTM来描述。DTM可以是每三个坐标值为一组元的散点结构，也可以是由多项式或Fourier级数确定的曲面方程。

从测绘角度看，DTM是新一代地形图。数字化的地形图，由大量地面点空间坐标和地形属性数据组成，以数字形式描述地形地貌。用途不同，数据结构不同，一般均可变换成栅格数据形式。

DEM是DTM的一个子集。实际上，DEM是DTM中最基本的部分，它是对地球表面地形地貌的一种离散的数字表达。

数字高程模型DEM是表示区域D上的三维向量有限序列，数字高程模型既然是地理空间定位的数字数据集合，因此凡牵涉到地理空间定位，在研究过程中又依靠计算机系统支持的课题，一般都要建立数字高程模型。从这个角度看，建立数字高程模型是对地面特性进行空间描述的一种数字方法途径，数字高程模型的应用可遍及整个地学领域。

7. DTM分析的因子有哪些，DTM的应用又有哪些

DTM的分析因子包括以下部分：

⑴坡度和坡向分析。

坡度定义为水平面和地形表面之间夹角的正切值；坡向为坡面法线在水平面上的投影与正北方向的夹角。

⑵地表粗糙度的计算。

地表粗糙度是反映地表的起伏变化和侵蚀程度的指标，一般定义为地表单元的曲面面积与其在水平面上的投影面积之比。

⑶地表曲率的计算

①地面剖面曲率计算

地面的剖面曲率（profile curvature）其实质是指地面坡度的变化率，可以通过计算地面坡度的坡度而求得。

②地面平面曲率计算

地面的平面曲率（plan curvature）是指地面坡度的变化率，可以通过计算地面坡向的坡度而求得。

数字地面模型具有定位、定量化优点，有着广泛的应用领域。可用于遥感影像地形畸变的自动校正，地球重力测量的自动校正，等高线、地形剖面、透视立体图及与地形有关的多种专题地图的自动绘制等；在工程勘测和规划方面，可用于公路、铁路、通讯线、输电线的选线和土方量算等：水利工程中的大坝和水库选址及设计，水库体积和容量的计算：电视塔、微波系统、军事制高点等地形选择，导航(包括导弹与飞机的导航)、覆盖区域视野范围的计算等。

DTM的具体应用包括以下内容：

⑴等高线绘制：等高线追踪与等高线光滑（插值）。

⑵立体透视图绘制：从数字高程模型绘制透视立体图是DEM的一个极其重要的应用。透视立体图能更好地反映地形的立体形态，与采用等高线表示地表形态变化有其自身独特的优点，非常直观，更接近人们的直观视觉。特别是随着计算机图形处理工作的增强以及屏幕显示系统的发展，使立体图形的制作具有更大的灵活性，人们可以根据不同的需要，对同一个地形形态做各种不同的立体显示。其基本处理过程为：透视变换、色调计算、隐藏面消除、图形输出等。

⑶地形剖面图绘制。

⑷DTM的地形分析：尽管DTM的应用十分广泛，但地形分析是其基本应用，其他应用都可由此推演、扩展。从DEM中可以自动提取地形因子，如坡度、坡向、高程变异、地表粗糙度、曲面面积、体积、谷脊特征分析等。

8. GIS的应用模型有哪些

GIS的应用模型包括以下几种：适宜性分析模型（叠加运算）、发展预测模型（动态模拟）、位址选择模型（空间区位-配置）。

先谈谈空间区位-配置信息模型。对于生产单位和服务企业来说，由于需求和供给两方面总是存在着空间上分布的差异性，因此，机构设施地理位置(Geographic location)的选择和确定对于它们的经济效益和自身的发展具有至关重要的影响作用。

机构设施位置的评价和优化，是通过对于一个设施或者一个设施网络的供给和需求两者之间的相互作用关系进行分析来实现其空间位置分布模式的优化。机构设施区位评价是对于现有服务设施的空间位置分布模式的评价，机构设施区位优化是对于其最佳位置的搜寻。

克理斯塔勒(Christaller)的中心地理论则为供给区位优化模式的理论研究和经验方法的应用提供了基础框架，这个理论中的市场区域规模是由供货和服务的范围决定的，需求和供给两者之间的关系是以距离最小化和利润最大化为基础建立的。

再谈谈空间决策信息模型。区划分析、土地利用规划、城镇区域发展规划、设施位置选择、资源开发和分配、环境管理等都是有关空间行为决策的问题。这些问题的解决方案是由决策者或问题领域的专家在专业领域知识和经验的启发下，在分析了大量地理信息(Geo—referenced info.)的基础之上得到的。