一、什么是GIS?
GIS,即地理信息系统(Geographic Information System),是一种用于捕捉、存储、管理、分析、展示和共享地理数据的技术和方法。GIS结合了地理信息科学、计算机科学、管理科学和数据分析等多个领域的知识。
GIS的主要功能包括:
数据管理:能够组织和存储各类地理信息数据,包括地图、卫星图像、调查数据等。
空间分析:可以对地理信息进行各种空间分析,比如距离计算、叠加分析、网络分析等。
可视化:通过地图和图形的方式直观地展示地理信息,帮助用户理解数据的空间分布和关系。
决策支持:为政策制定者、城市规划者、环境保护者等提供数据支持,帮助他们做出科学合理的决策。
GIS广泛应用于城市规划、环境监测、交通管理、灾害应对、资源管理等多个领域。
1.重要的地理学定律:
空间相关性定律:任何事物都是空间相关的,距离近的事物比距离远的事物的空间相关性更大。
空间异质性定律:空间的隔离造成了地物之间的差异,即异质性。
二、gis如何表示地理信息?
1.地球是圆的吗?
不是,地球是一个两极略扁,中间略大的不规则球体。高低起伏是不一样的,赤道半径较长,两极半径较短。
大概这个样子:
想要对不规则的球体进行地理信息的表示,通过以下步骤进行:
2.大地水准面
为了使用数学法则来描述崎岖不平的地球表面,必须寻找一个相对规则的数学模型。因此,我们假设一个与静止的平均海水面重合并延伸至大陆内部的封闭曲面,这便构成了大地水准面。
3.参考椭球体
大地水准面忽略了地球表面上的凸凹不平,但由于地球内部物质分布的不均匀性,大地水准面本身仍然存在起伏。为了定量描述地球的形状并消除起伏的影响,测量中采用了与大地水准面最吻合的旋转椭球体,这一椭球体被称为地球椭球体。通过选择一个与地球的大小和形状相近的椭球体作为数学模型,可以便利地进行测量和制图。
4.基准面
有了参考椭球体来表示地球,还需要将地球和参考椭球体联系起来,确定位置。于是提出了基准面的概念来控制参考椭球和地球的相对位置。 基准面分为绝对定位和参考定位。
(1)绝对定位
将地球质心作为原点,通过卫星数据获得的坐标系具有较高的精度,被称为地心坐标系。地心坐标系是以地球质心为原点构建的空间直角坐标系统,或是以与地球质心重合的地球椭球面为基准面所建立的大地坐标系。这一大地坐标系以地球质心(即总椭球的几何中心)为原点,通常分为两种类型:地心空间直角坐标系(以x, y, z为坐标元素)和地心大地坐标系(以B, L, H为坐标元素)。
(2)参考定位
特定区域内与地球表面吻合。 构成参心坐标系。
参心坐标系是以参考椭球的几何中心为基准的大地坐标系。通常分为:参心空间直角坐标系(以x,y,z为其坐标元素)和参心大地坐标系(以B,L,H为其坐标元素)。
5.地理坐标系
在大地测量中,以参考椭球体为基准面建立的坐标系统,通常使用大地经度和大地纬度来表示地面点位的球面坐标。基准面的确定标志着地理坐标系的建立。在地理坐标系中,经度和纬度通常使用十进制单位表示。常用的地理坐标系包括北京1954、西安1980、WGS84及CGCS2000。在不同坐标系下,同一位置的坐标数值可能存在较大差异。
地理坐标系=椭球体+基准面
CGCS2000的定义与WGS84实质一样。采用的参考椭球非常接近。扁率差异引起椭球面上的纬度和高度变化最大达0.1mm。当前测量精度范围内,可以忽略这点差异。同时大多数地图软件只提供WGS84坐标系的数据。
长半轴(m)反扁率
WGS 84 6378137 298.2572236
CGCS2000 6378137 298.2572221
6.投影坐标系
地球椭球表面是一种不可能直接展开的曲面。当该曲面转换为平面时,必然会形成裂隙或褶皱。由于地球椭球体的表面为曲面,因此无法在平面上展开,从而影响距离、方位和面积等参数的测量与制图。地图投影是一种在地球椭球面与平面之间建立点与点之间函数关系的数学方法。
地理坐标系+对地图投影的方法=投影坐标系
主要的投影类型包括圆锥投影、圆柱投影以及方位投影。根据投影面与地图投影方向的不同,投影可分为正轴、横轴和斜轴。所有地图投影在某些方面均会引起形变。在实际应用中,应根据地图的使用目的来限制某种形变。
常用的投影:
墨卡托投影:
正轴等角圆柱投影,角度不变、为航海设计,面积会巨大变形,两极地区严重。分为utm投影(通用横轴墨卡托投影)和web墨卡托投影。
web墨卡托投影:高德、百度、腾讯等互联网地图使用的地图投影,主要区别是把地球模拟为球体而非椭球体。
兰勃特投影:
正轴等角割圆锥投影是一种保角的地图投影方法,具有形状准确且不产生角度变形的特点。该投影特别适用于中纬度地区,包括中国地图及其省级地图。在构建投影时,通常选取一条中央经线和两条纬线, 中国选用中央经线为东经105°,北纬25°和北纬47°。
阿尔伯斯投影:
是一种正轴等积割圆锥投影的地图投影方法,其特征是能够保持投影区域的面积与实际地面区域相等。这种投影特别适用于东西方向分布的大陆板块,并可有效展示全国范围内的400W和100W的数据。
高斯-克吕格投影:
是一种等角横切椭圆柱投影,投影后角度不变,中央经线是直线,投影后不变形,离中央经线越远变形越大,大于等于1:50W的地形图都会采用高斯克里格投影方式。
为控制投影后的长度变形,采用分带投影方法
常用分带投影:
3度带起始于东经的1度30分,适用于大于1:1万的比例尺的地图,我国分为22个分度带,25-45度带
6度带起始于本初子午线,全球共分为六十个投影带,中国对应13-23度带,用于1:2.5w到1:50w的比例尺图上
这样的分带方法使得6度带的中央经线均为3度带的中央经线
每个带内布置了平面直角坐标系系统,坐标系原点为每个投影带的中央经线与赤道交点
我国均在北半球,y值都为正值,为避免x轴出现负值,规定各点均在横轴的方向向东偏移500千米。在东西方向坐标值前加上所在带号
针对国内坐标如果看到x值是8位,y值为7位,就能够确定是添加了带号的高斯克吕格投影,x的前两位是带号,
带号在25之前是6度带,带号在25之后说明是3度带。
一般1:5万地形图是采用3度分带投影的,地形图上公里网横坐标前2位就是带号,例如地形图上的横坐标为39386185.12,其中39即为带号,386185.12为横坐标值。
高斯克吕格投影的命名规则是:
有3是3度带、有CM(表示中央经线)表示不带带号、有n表示不带带号
CGCS2000 3 Degree GK CM 117E(三度分带国家2000坐标系,中央经线为东经117,横坐标前不带带号)
CGCS2000 3 Degree GK Zone 39 (三度分带国家2000坐标系,中央经线为东经117,横坐标前加带号)
CGCS2000 GK CM 117E(六度分带国家2000坐标系,中央经线为东经117,横坐标前不加带号)
CGCS2000 GK Zone 20 (六度分带国家2000坐标系,中央经线为东经117,横坐标前加带号)
7.互联网地图的坐标系
(1)高德地图
1)境内:GCJ-02
a、WGS-84->GCJ-02(高德有接口提供,反过来没有)
2)境外:暂不支持
(2)百度地图
1)境内(包括港澳台):BD09
a、在GCJ-02坐标系基础上再次加密
b、支持WGS-84、GCJ-02转换成BD09,反向不支持,并且批量转换一次有条数限制
2)境外:WGS-84
(2)谷歌地图
1)境内:GCJ-02
a、数据来源于高德,两者互通
2)境外:WGS-84
(4)官方发布
GCJ-02 坐标系:国测局坐标,火星坐标系
1)国测局02年发布的坐标体系,它是一种对经纬度数据的加密算法,即加入随机的偏差。
2)互联网地图在国内必须至少使用GCJ-02进行首次加密,不允许直接使用WGS-84坐标下的地理数据,同时任何坐标系均不可转换为WGS-84坐标。
8.坐标系转换
(1)EPSG
EPSG(European Petroleum SurveyGroup)的目的是为了满足坐标数据分享与交换的需要,通过维护一个全球统一的空间参考系统数据库,使得有名有姓的坐标系、坐标转换参数都能在这里领到身份证。这个数据库不仅包括了广泛应用的WGS-84坐标系代号,如EPSG:4326,还包括了其他各种地理坐标系和投影坐标系,为测绘地理信息行业的开放与共享提供了基础。
用途:
EPSG用于标识不同的地理空间参考系统,包括坐标系统、地理坐标系、投影坐标系等。这些标识符可用于许多应用程序和地理信息系统软件,以确保数据在不同系统之间的正确转换和处理。
EPSG是将常用的坐标系、投影、地理坐标系等地理空间参考系统的名称、参数、定义等信息进行标准化,并赋予一个唯一的编码。
常见的EPSG编码:
EPSG:4326是WGS84坐标系
EPSG:3857是Web墨卡托投影坐标系
EPSG:4214是Beijing 1954地理坐标系统
EPSG:4610是Xian1980地理坐标系统
EPSG:4490是CGCS2000中国国家2000地理坐标系统
查询坐标系信息及EPSGID
https://epsg.io/
(2)坐标系转换(以高德地图为例)
使用gis工具可进行坐标系的转换并且进行重投影。
例如得到的坐标系为CGCS2000,转换为高德地图坐标并进行Web墨卡托投影,转换步骤如下:
EPSG4490–> EPSG4326–> GCJ02–> EPSG3857
坐标经过GCJ02加密后会产生偏移
三、GIS数据如何存储和表示
1.矢量数据
矢量数据是基于点、线、多边形等几何要素及其属性信息来描述地理空间数据的。矢量地图通常由矢量数据集组成,这些数据集可以通过各种格式(如ESRI Shapefile、GeoJSON、KML等)来表示。
(1)shapefile文件
Shapefile 是一种广泛使用的地理信息系统(GIS)数据格式,它通常由一组相关文件组成,每个文件存储不同类型的信息。以下是 Shapefile 的主要组成部分及其功能:
.shp(主文件):
存储几何要素的坐标信息,包括点、线和面。这个文件是 Shapefile 的核心,定义了空间数据的实际形状。
.shx(几何索引文件):
包含指向主文件中几何要素的索引,提供快速访问以加速空间查询和数据处理。
.dbf(属性数据文件):
一个 dBASE 文件,用于存储每个几何要素的属性信息,例如名称、长度、分类等。这些属性与几何形状关联,形成完整的数据集。
.sbn / .sbx(空间索引文件):
存储要素的空间索引,进一步加速空间查询和处理操作。这些文件可以提高 GIS 软件在处理和检索数据时的效率。
.prj(投影信息文件):
存储坐标系和投影信息,确保用户理解数据的空间参考。该文件帮助用户在地图上正确定位要素。
.xml(元数据文件):
包含关于 Shapefile 的详细元数据,提供数据集的背景信息,如来源、用途等。
.cpg(字符编码文件):
指定 Shapefile 中字符编码的信息,确保软件能够正确处理属性数据中的字符串,特别是在涉及不同语言或特殊字符时。
.qmd(QGIS 样式文件):
通常与 QGIS 相关,保存地图样式和元数据,帮助用户快速重建地图的外观和布局。
shp、shx、dbf为必须文件。
Shapefile 可以通过 .prj 文件来包含坐标系信息。.prj 文件使用文本格式,定义了数据的坐标参考系统(CRS)。这使得用户在加载 Shapefile 时能够知道数据使用的坐标系,从而进行正确的空间分析和地图制作。
(2)GeoJSON文件
GeoJSON 是一种基于 JSON格式的开放标准,用于表示地理特征和其属性。GeoJSON 文件通常以 .geojson 的扩展名保存。一般默认使用的是 WGS 84 坐标系。
支持多种几何类型:
点(Point):表示单个地理位置。
线(LineString):表示由一系列坐标点连接成的线。
面(Polygon):表示由多个坐标点闭合成的区域。
MultiPoint、MultiLineString、MultiPolygon:用于表示多个点、线或面的集合。
属性信息:GeoJSON 文件允许对每个地理特征附加属性信息,提供有关特征的更多上下文。
兼容性:GeoJSON 被广泛支持于各种 GIS 软件、Web 地图 API(如 Leaflet 和 OpenLayers)以及许多数据库(如 PostGIS 和 MongoDB)。
(3)KML文件
KML是一种用于表示地理特征的 XML 格式。KML 文件通常以 .kml 扩展名保存,并可以通过多种应用程序进行查看和编辑。一般默认使用的是 WGS 84 坐标系
支持多种地理特征:
点(Placemark):表示单个位置,可以附加图标和信息。
线(LineString):表示由连续坐标点连接的线。
面(Polygon):表示由多个坐标点形成的区域。
多个特征:KML 也支持多重特征,如 MultiGeometry。
附加样式与信息:KML 允许开发者定义样式(如颜色、图标、图形透明度)、描述和其他属性,便于用户理解和展示信息。
地理标记:KML 可以包含时间标签、链接、图形叠加层等丰富的地理标记功能,用于描述地理现象的时间和位置信息。
KMZ 文件是将 KML 文件及其相关资源(如图像、模型等)压缩成一个单一的文件,以简化文件的分享和存储。
(4)GML文件
GML是一种用于描述地理信息的 XML 标记语言。它被设计用来表示地理特征及其属性,广泛用于地理信息系统(GIS)和网络服务中,以便于存储和交换空间数据。
GML 是 OGC(开放地理空间协会)标准的一部分,常与其他标准(如 WFS、WMS)一起使用,便于地理数据的共享和交换。
(5)其他文件类型
DWG (.dwg)
用途:常用于 CAD 软件,如 AutoCAD,存储设计图纸和工程图。包含丰富的建筑和工程图形信息。
DXF (.dxf)
用途:一种 CAD 文件格式,主要用于 CAD 数据的交换。可以存储二维和三维图形。
2.栅格数据
栅格数据是地理信息系统(GIS)中一种常用的数据表示方式,用于存储空间数据。它由一系列规则排列的网格像素(或栅格单元)组成,每个像素包含一个数值,该数值通常表示某种特定的地理特征或现象。例如,栅格数据可以用来表示高程、温度、植被覆盖率等。
网格结构:栅格数据由行(横向像素)和列(纵向像素)组成,形成一个矩形网格。
分辨率:决定了栅格的细节和精确度,分辨率越高,像素越小,能够捕捉到更多的细节。
数据类型:栅格数据的值可以是整数、浮点数等,具体取决于所表示的特征。
常见的栅格数据格式:
(1)GeoTIFF (.tif/.tiff):
一种扩展的 TIFF(Tagged Image File Format),包含地理信息元数据,可以支持多种数据类型(如单波段、彩色图像等),广泛用于遥感和地理信息项目。
(2)Gridded Binary (GRIB):
常用于气象数据的存储,特别适合大规模数值模型输出,包含时间、空间和物理参数数据。
(3)NetCDF (.nc):
主要用于存储多维科学数据,特别适合气候、气象和海洋学应用,提供了丰富的格式以存储和解析大数据集。
(4)ERDAS Imagine (.img):
一种栅格数据格式,主要用于遥感和地理分析,支持多波段图像和压缩形式。
(5)Ascii Grid (.asc):
以文本格式储存栅格数据,非常易于人类阅读,但不如二进制格式高效,常用于简单的地形数据。
(6)ECW (.ecw)(Enhanced Compression Wavelet):
一种用于存储地理图像的压缩格式,支持快速加载和查看,适合用于大尺寸影像。
(7)JPEG 2000 (.jp2):
一种压缩图像格式,支持渐进式传输和较高的压缩比,可用于存储高分辨率的栅格数据。
(8)SRTM (.hgt):
具体用于存储由 Shuttle Radar Topography Mission 生成的地形数据,适用于数字高程模型(DEM)。
3.格式转换
不同软件地理文件后缀编码方式会有差异,但是包含的信息基本都是相同的,因此大多数文件格式之间都可以进行相互转换。
如果能够使用矢量数据全部使用矢量数据,矢量数据可以转栅格,但栅格无法转为矢量数据。
(1)格式转换网站
https://mapshaper.org/
(2)QGIS或ArcGIS自带的转换工具
使用gis工具自带的转换工具可以进行格式的转换
(3)转换软件FME
利用FMEWorkBench和FMEQuickTranslator实现所有文件之间的无损转换
补充:
高程坐标系
空间点的高程是以大地水准面为基准建立的,高程是地面上任意一点沿铅垂线方向至该高程系统所选的水准面的距离,也称该点的绝对高程或海拔。
地面点在大地水准面上,H为正。地面点在大地水准面下,H为负。单位为M。
相对高程:地面点到某一假定水准面的垂直距离,称为该点的假定高程,也称相对高程。
高差:地面上两点高程之差。高差有正负。
高程基准:
高程基准是推算国家统一高程控制网中所有水准高程的起算依据,它包括一个水准基面和一个永久性水准原点。
水准基面:统一计算地貌高程的起算面(点)。是大地测量基准的一种 。
通常理论上采用大地水准面,它是一个延伸到全球的静止海水面,也是一个地球重力等位面,实际上确定水准基面则是取验潮站长期观测结果计算出来的平均海面,也称大地水准面。我国规定黄海平均海平面作为大地水准面。
水准原点:地上预先设置好的一个固定点,定出这个点的高程作为全国水准测量的起算高程,这个固定点称为水准原点。
国家提出过两个高程基准:1956年黄海高程系(72.2604m)和1985年国家高程基准(72.289m),两者存在线性关系H85=H56-0.029m
EGM96模型是美国推出的一种适用于全球范围,并综合利用现有全球大量重力数据所计算出来的高精度大地水准面模型。采用该模型可以解算全球任何一点的大地水准面差距,其精度在美国本土50km的范围内达厘米级。
似大地水准面:
严格来说,似大地水准面并不是水准面,但是接近于水准面,只是用于计算的辅助面。从地面点沿正常重力线量取正常高所得端点构成的封闭曲面,即为似大地水准面,它与大地水准面并不完全吻合。
由数学模型精确确定的与大地水准面最拟合的面是地球椭球的参考椭球面,似大地水准面到参考椭球面的距离为高程异常。
对于地面一点来说,该点到参考椭球面的距离为大地高,到大地水准面的距离为正高,到似大地水准面的距离为正常高。
大地水准面高,也称大地水准面起伏或大地水准面差距,指大地水准面上的一点沿法线投影至参考椭球面上的距离。
椭球高与海拔高之间的转换计算关系:
由于地形的起伏不同,不同区域的海拔高度和椭球高直接的差值不同,这个差值叫高程异常,换算公式非常简单,用户知道高程异常值的话,进行加减就可以了。
高程异常值:似大地水准面至地球椭球面的高度。高程异常值可联系国家测绘部门获取。
大地高=正高+大地水准面高
大地高=正常高-高程异常
海拔高度(大地水准面的距离)=大地高(椭球高度)+高程异常值
数字高程模型,简称DEM,是通过有限的地形高程数据实现对地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形式表示地面高程的一种实体地面模型,它是一种数字阵列信息模型(x,y,z),描述地理空间中的地形高低起伏,通过表示模型和渲染后,成为人们看到的地形图。
全球数字高程最主要的来源大概为两类:SRTM和COPERNICUS。
SRTM产生的数字高程模型提供了全球范围内30米和90米分辨率的地表高程数据。数字高程模型通过将地球表面划分为网格,每个格点上有对应的高程数值,以描绘地球表面的立体形状。
Copernicus DEM产品的一个示例是Copernicus高程数据集(Copernicus DEM,CDEM),也称为Copernicus数字地形模型。这个数据集提供了全球范围内的数字高程模型,覆盖了地球的陆地表面。