系列文章目录
3小时GIS入门教程(一)为什么要学GIS
3小时GIS入门教程(二)GIS数据格式、坐标系
3小时GIS入门教程(三)ArcGIS 10基本操作
文章目录
前言
近年来,随着爬虫技术的完善,互联网地理数据被越来越多的人使用和研究,大家往往拿到一些位置点信息,比如POI(point of interest)数据、房产信息数据,它们都关联到真实物理世界的具体位置。那么,如何将这些带有坐标的表格数据转成GIS数据,并最终落到地理空间上进行地理分析呢?
离一张好看的地图只差五步哦!!
一、案例数据
文件名称 | 说明 | 操作建议 |
---|---|---|
六普区.shp | 包含上海各区县的形状数据 | 作为底图和空间连接图层 |
房产地理数据.xlsx | 包含上海全市房产的经纬度位置和属性数据 | 先转成csv文件,再进行展点和属性连接。 |
数据资料网盘链接:
链接:https://pan.baidu.com/s/1vqiW_8JO8A23XWSu69ynog?pwd=ww3z
提取码:ww3z
二、实验内容
实操内容主要包括四部分:
- 数据GIS化:根据提供的一些互联网数据,完成GIS化、矢量化,生成准确坐标系的shp文件
- 空间选择:根据筛选目标筛选计算结果并导出计算结果
- 空间统计:统计某些属性字段在特定区域的总量
- 空间分析:探究房产数据在全市的分布情况(密度分析)
- 制图表达:根据成图目标完成专题图制图(点图、分布密度图)
1.数据GIS化
需要将包含位置信息的excel表格(房产地理数据.xlsx)转换成点图层
房产地理数据.xlsx 包含如下字段,字段解释如下表。
字段名称 | 字段说明 |
---|---|
Id | 小区编号 |
District | 所在区(由于统计误差,这个字段不一定准确) |
ResidenceRame | 小区名称 |
ResidenceLon | 小区所在经度 |
ResidenceLat | 小区所在维度 |
ResidenceAccomplishDatetime | 小区建成时间 |
2.空间筛选
(1)筛选出在浦东新区的所有小区
(2)筛选出距离浦东新区边界2km内的所有小区
(3)筛选出2000年以后建成的小区
3.空间统计
统计不同行政区内的房产数量并进行分级显示
要求分别采用5种分类方法分别成图,分类方法包括自然间断法、分位数法、等间隔法、几何间隔法
4.空间分析
对市域内房产进行密度分析(点密度分析以及核密度分析法)
5.制图表达
(1)成图图片像素>=300dpi
(2)底图简洁,地图配色美观
(3)具备地图三要素,图例、指北针、比例尺
三、数据GIS化操作
1.将excel表格转为csv文件
- 打开“房产地理数据.xlsx”
- 将文件另存为CSV(逗号分隔)文件。
2.将csv文件导入Arcmap
-
打开ArcMap,先保存工程文件(十分建议,防止arcgis的日常崩崩崩),选择保存路径,并修改命名为“地产数据分析.mxd”,点击保存(下一次直接打开工程文件你就能看到之前做的图啦)。
-
点击添加数据(add data),将csv文件添加进来。
3.根据经纬度信息转成Point文件
-
右键点击文件名称,选择Display XY Data。
-
选择x,y坐标的字段名称,注意横轴为x轴,纵轴为y轴,所以X轴为经度,Y轴为纬度。
选择坐标值的坐标系,若为WGS84经纬度坐标,则选择GCS_WGS_1984。
-
点击OK,提示文件没有id属性,暂时不用管,继续点击OK。
这样,在屏幕上就能看到矢量的点啦~~~
4.将点另存为GIS点文件
由于现在生成的点还只是临时文件,需要将数据另存为shp文件。
-
点击点图层,右键选择“数据(Data)”,再选择导出数据(Export Data)
-
选择你要保存的路径,并将文件命名为“estatepoint.shp”,点击保存
-
会提示保存的进度条,等待即可
-
完成之后提问是否需要将刚刚保存的图层加载进来,点击“是(yes)”
5.给点文件匹配上房产属性
现在生成的点文件还只有点的位置信息,缺少建成年份、小区名称等属性信息,因此需要根据小区id将属性进行匹配。
-
右键点击“joins and relatess”–>选择join
-
选择“join attributes from a table”->选择id作为点图层的连接属性->选择需要匹配的属性表格(房产地理数据.csv)->选择在匹配的表格中的连接属性(id)->点击OK
在属性表中即可看到建成年份等信息
-
匹配好的表格只是临时匹配,需要将点文件另存为新文件,命名为“estatepoint_join.shp”
三、空间筛选操作
1.筛选出在浦东新区的所有小区
-
加载上海行政区的地理文件“六普区.shp”
注:虽然表格里有行政区字段,可以通过行政区字段进行筛选,但是由于数据可能存在误差,在这里严格按照地理位置进行筛选。 -
先从行政区文件中筛选出浦东新区,select features->点选中浦东新区
-
将选中的浦东新区创建一个新的图层
-
基于空间位置选择(select by location)出落在浦东区面域上的小区点
至此,就筛选出了落在浦东新区上的小区
- 再将选择的数据导出成一个新的图层"estatepoint_pd.shp"即可,导出的时候注意选择“selected features”
2.筛选出距离浦东新区边界2km内的所有小区
分两步走,首先要将浦东新区的面文件转成线文件,然后通过距离进行选择
(1)面转线
-
将选择的浦东新区文件另存为一个面文件“浦东新区.shp”
-
进行面转线
在ArcToolbox中找到“Feature To Line”或者"Polygon To Line"功能,选择要转换的面文件“浦东新区.shp”即可。
(2)通过距离选择2km以内的点
-
点击select by location
-
空间选择方法处选择“are within a distance of the source layer feature”,然后选择km为距离单位,输入2,点击OK
可以看到距离边界2km的点被选择高亮出来
- 再将选择的数据导出成一个新的图层"estatepoint_pd2km.shp"即可,导出的时候注意选择“selected features”
3.筛选出2000年以后建成的小区
分两步走,第一步先将建成年份字段处理成年份(数字类型),第二步再根据属性进行筛选
(1)处理年份字段
-
打开属性表
-
添加字段
添加一个命名为“year”,类型为“short integer”的字段
-
字段计算
右键点击“year”列,选择field calculator,输入字符串计算方法取日期最左侧四位数字,Left(date,4)
可以看到计算结果如下
(2)属性筛选
-
利用属性表进行字段筛选,sql语句为"year">=2000
-
再将选择的数据导出成一个新的图层"estatepoint_2000.shp"即可,导出的时候注意选择“selected features”
四、空间统计及分级显示操作
1.空间统计
汇总不同行政区的小区数量,将点图层同行政区图层进行关联,即可计算出各行政区小区的总数
-
右键点击“六普区.shp”,选择join
-
连接模式选择“join data from another layer based on spatial location”,汇总统计选择“Sum”,参考下图进行操作,点击OK,空间连接计算较复杂,需要等待一会。
-
会生成一个新的图层“行政区级别汇总.shp”,可以看到结果列“Count_”已经统计好每个行政区的小区数量
2.分级显示
-
双击或右键点击图层“行政区级别汇总.shp”,切换到“Symbology”页面,选择Quantities->Graduated colors分级色彩,选择分级字段为“Count”,点击ok
自然间断法5级结果如下
-
修改分类数量和分类方法
系统默认分类方法为自然间断法,分类数量为5级,可以手动进行调整
-
常用的ArcGIS分级方法
a)相等间隔Equal Interval
相等间隔会将属性值的范围划分为若干个大小相等的子范围。您可以指定间隔数,ArcGIS 将基于值范围自动确定分类间隔。例如,如果为取值范围为 0-300 的字段指定三个类,ArcGIS 将创建三个类,其取值范围分别为 0–100、101–200 和 201–300。
相等间隔最适用于常见的数据范围,如百分比和温度。这种方法强调的是某个属性值相对于其他值的量。例如,它可显示某个商店为一组商店的一部分,而该组商店的销售额占总销售额的三分之一。
b)定义的间隔Defined Interval
通过定义的间隔可指定一个间隔大小,用于定义一系列值范围相同的类。例如,每个间隔的长度为 75 个单位。ArcMap 将基于间隔大小和所有字段值的范围来确定类的数量。在下面的示例中,间隔大小被指定为 4%。
c)分位数Quantile
每个类都含有相等数量的要素。分位数分类非常适用于呈线性分布的数据。分位数为每个类分配数量相等的数据值。不存在空类,也不存在值过多或过少的类。
d)自然间断点分级法Natural Breaks (Jenks)
“自然间断点”类别基于数据中固有的自然分组。将对分类间隔加以识别,可对相似值进行最恰当地分组,并可使各个类之间的差异最大化。要素将被划分为多个类,对于这些类,会在数据值的差异相对较大的位置处设置其边界。
自然间断点是数据特定的分类,不适用于比较使用不同基础信息构建的多个地图。
e)几何间隔Geometrical Interval
“几何间隔”分类方案用于根据具有几何系列的组距创建分类间隔。分类器中的几何系数可以更改一次(可更改为其倒数),以便优化类范围。该算法创建几何间隔的原理是,使每个类的元素数的平方和最小。这可确保每个类范围与每个类所拥有的值的数量大致相同,且间隔之间的变化非常一致。
f)标准差Standard Deviation
“标准差”分类方法用于显示要素属性值与平均值之间的差异。ArcMap 可计算平均值和标准差。将使用与标准差成比例的等值范围创建分类间隔 - 间隔通常为 1 倍、1/2 倍、1/3 倍或 1/4 倍的标准差,并使用平均值以及由平均值得出的标准差。使用两种颜色的色带有助于突出显示位于平均值以上的值(显示为蓝色)以及位于平均值以下的值(显示为红色)。
五、空间分析操作
需要探究全市的小区分布情况,常常使用密度分析方法
-
选择ArcToolBox中的密度分析工具
-
进行密度分析,对比核密度与点密度
选择加载需要进行密度分析的图层"estatepoint _join",然后需要选择搜索半径,一般可以按照默认,然后点击OK
-
对核密度图进行分类显示,密度为0的点不显示颜色
一张好看的密度图就做好拉~
点密度与核密度分析的区别
- 相同点:两者都是用于计算每个输出栅格像元周围的点要素的密度
- 不同点:简单来说就是核密度可将各点的已知总体数量从点位置开始向四周分散,而点密度只计算点本身的位置。**
- 点密度分析:每个栅格像元中心的周围都定义了一个邻域,将邻域内点的数量相加,然后除以邻域面积,即得到点要素的密度。
- 核密度分析:每个点上方均覆盖着一个平滑曲面。在点所在位置处表面值最高,随着与点的距离的增大表面值逐渐减小,在与点的距离等于搜索半径的位置处表面值为零。仅允许使用圆形邻域。
六、制图表达操作
如何输出一张高分辨率、简洁美观的地图,是GIS可视化的关键问题,关于美学的东西很难有标准,以下就简单介绍下出图的操作。
- 首先点击页面下方小图标切换到“视图页Layout View”
2. 加载Layout工具条
在工具栏空白处右键即可找到Layout工具条
-
点击工具条中的“layout change ”,选择输出图片的画布尺寸
一般习惯用横版出图,有时候图片要插入到word或者PPT 中,因此通常选择ISO A4 Lanscape 210mm*297mm
-
将地图缩放至图层,图形将会自动填充满画布
-
插入地图三要素,比例尺、指北针和图例,具体个性化设置可以右键操作
-
导出地图File->Export Map另存为jpg/png->设置像素,一般满足打印需要采用300dpi
-
至此,一张完整的图片就已经输出到本地啦
总结
以上就是实际案例的所有操作流程,如有疑问欢迎咨询。
最后祝愿大家都能武装好GIS理论,掌握好GIS基本操作,高效帮助大家解决一些实际中遇到的空间问题!