地学计算方法/地统计学(第二章地理数据及其采集与预处理)

本文详细介绍了地理数据的类型、基本特征和采集处理过程,包括空间和属性数据、数据的不确定性、多尺度性以及多维性。在数据预处理阶段,涉及统计整理、正态分布检验和数据转换,如平均值、中位数、离散程度指标等。此外,文章还讨论了异常值的识别和处理方法,以及相关分析和回归分析的基本概念。
摘要由CSDN通过智能技术生成

2第二章 地理数据及其采集与预处理

2.1地理数据类型

  • 空间数据:用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围及空间联系,包含有点、线、面,点线面之间的拓扑关系。
    在这里插入图片描述
  • 属性数据:用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征

数量标志数据
间隔尺度数据:以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。

比例尺度数据:以无量纲的数据形式表示测度对象的相对量

品质标志数据

有序数据:当测度标准不是连续的量,只是表示其顺序关系的数据

二元数据:用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题

名义尺度数据:用数字表示地理实体、地理要素、地理现象或地理事件的状态类型

2.2地理数据基本特征

  • 数量化、形式化、逻辑化:定量化的地理数据是建立地理数学模型的基础,其作用为:确定模型的参数、给定模型运行的初值条件;检验模型的有效性。形式化、逻辑化与数量化,是所有地理数据的共同特征。
  • 不确定性:地理系统本身的复杂性从本质上决定着地理数据的不确定性
  • 多种时空尺度:从空间尺度上来看,描述地理区域的各种地理数据,具有多种空间尺度——既有全球尺度的、洲际尺度的、国家尺度的,也有流域尺度的、地区尺度的、城市尺度的、社区尺度的,从时间尺度上来看,描述地理过程的各种地理数据具有多种时间尺度,如历史年代、天、月、季度、年等
  • 多维性:一个地理对象的具体意义要从空间、属性、时间三个方面综合描述,空间方面,描述该地理对象所处的地理位置和空间范围,一般需要2~3个变量,属性方面,描述该地理对象的具体内容,至少需要1个以上,多则需要十几个、甚至几十个变量,时间方面,描述该地理对象产生、发展和存在的时间范围 ,需要1个变量,地理数据的多维性,被描述为地理数据立方体。(the geographical data cube)

2.3地理数据的采集与处理

2.3.1地理数据采集

地理数据的渠道来源
①来自于观测、测量部门的专业数据。
②来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据。
③来自于有关单位或个人的不定期的典型调查数据、抽样调查数据。
④来自于政府公报、文件中的有关数据
⑤来自于档案、图书等文献资料中的有关数据。
⑥来自于互联网(Internet)的有关共享数据。
⑦来自地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。
⑧来自遥感数据。主要包括各种航空遥感数据和卫星遥感数据。
⑨其他来源的有关数据。
采集地理数据过程中需要注意的问题
①数据的完备性和可靠性。
②在数据采集过程中,最大限度地减小数据的误差。
③在数据采集完毕后,进行检验,辨别真伪,通过数据筛选,去粗取精、去伪存真

2.3.2地理数据处理

地理数据处理,是地理问题研究的核心环节。
从理论上讲,在地理学中,数学方法的运用主要有两个目的:(1)运用数学语言对地理问题的描述,建立地理数学模型,从更高、更深层次上揭示地理问题的机理;(2)运用有关数学方法,通过定量化的计算和分析,对地理数据进行处理,从而揭示有关地理现象的内在规律

2.4地理数据的统计预处理

2.4.1统计整理

①统计分组,就是根据研究目的,按照一定的分组标志将地理数据分成若干组。
②计算各组数据的频数、频率,编制统计分组表。
③作分布图。

2.4.2几种常用的统计指标与参数

2.4.2.1描述地理数据一般水平的指标

平均值未分组 x ˉ = 1 n ∑ i = 1 n x i \bar{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i} xˉ=n1i=1nxi 分组 x ˉ = ∑ i = 1 m f i x i ∑ i = 1 m f i \bar{x}=\frac{\sum_{i=1}^{m} f_{i} x_{i}}{\sum_{i=1}^{m} f_{i}} xˉ=i=1mfii=1mfixi

中位数未分组排在中间的位置

分组 M e = L + d × 1 2 ∑ i = 1 n f i − S m − 1 f m M_{e}=L+d \times \frac{\frac{1}{2} \sum_{i=1}^{n} f_{i}-S_{m-1}}{f_{m}} Me=L+d×fm21i=1nfiSm1 M e = U − d × 1 2 ∑ i = 1 n f i − S m + 1 f m M_{e}=U-d \times \frac{\frac{1}{2} \sum_{i=1}^{n} f_{i}-S_{m+1}}{f_{m}} Me=Ud×fm21i=1nfiSm+1

M e M_e Me代表中位数;
L L L为中位数所在组的下限值;
U U U为中位数所在组的上限值;
f m f_m fm为中位数所在组的频数;
S m − 1 S_{m-1} Sm1为中位数所在组以下的累计频数;
S m + 1 S_{m+1} Sm+1为中位数所在组以上的累计频数;
d d d为中位数所在组的组距

众数:未分组 频数最大的 分组 M 0 = L + d × Δ 1 Δ 1 + Δ 2 M_{0}=L+d \times \frac{\Delta_{1}}{\Delta_{1}+\Delta_{2}} M0=L+d×Δ1+Δ2Δ1 M 0 = U − d × Δ 2 Δ 1 + Δ 2 M_{0}=U-d \times \frac{\Delta_{2}}{\Delta_{1}+\Delta_{2}} M0=Ud×Δ1+Δ2Δ2

M 0 M_0 M0代表众数;
L L L为众数所在组的下限值;
U U U为众数所在组的上限值;
Δ 1 \Delta_1 Δ1为众数组频数与上一组频数之差;
Δ 2 \Delta_2 Δ2为众数组频数与下一组频数之差;
d d d为众数所在组的组距

计算举例

平均数:
x ˉ = ∑ i = 1 m f i x i ∑ i = 1 m f i = ( 300 ∗ 2500 + 1300 ∗ 3500 + 200 ∗ 4500 + 150 ∗ 5500 + 100 ∗ 6500 + 50 ∗ 7500 + 30 ∗ 8500 ) / 2130 = 3899.06 \bar{x}=\frac{\sum_{i=1}^{m} f_{i} x_{i}}{\sum_{i=1}^{m} f_{i}}\\ =(300*2500+1300*3500+200*4500+150*5500+100*6500\\ +50*7500+30*8500)/2130=3899.06 xˉ=i=1mfii=1mfixi=(30025

# **地学计算方法** # 1第一章 绪论 ## 1.1地统计学概念 **地统计学**是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关性和依赖性的自然现象的科学 **地统计学与经典统计学的区别** - 经典统计学的变量必须是纯随机变量,即其取值按某种概率分布而变化,地统计学研究的变量不是纯随机变量,而是区域化变量,该区域化变量根据其在一个域内的空间位置取不同值,它是随机变量与位置有关的随机函数。因此,地统计学中的区域化变量既有随机性,又有结构性 - 经典统计学所研究的变量理论上可无限次重复或进行大量重复观测试验,地统计学研究的变量不能进行这样的重复试验。因为区域化变量一旦在某一空间位置上取得一次样品后,就不可能在同一位置再次取得该样品,即区域化变量取值仅有一次 - 经典统计学的每次抽样必须独立进行,要求样本中各个取值之间相互独立。地统计学中的区域化变量是在空间不同位置取样,因而,两个相邻样品中的值不一定保持独立,具有某种程度的空间相关性。 - 经典统计学以频率分布图为基础研究样本的各种数字特征。地统计学除了要考虑样本的数字特征外,更主要的是研究区域化变量的空间分布特征。因此,地统计学的主要研究室围绕着变量的空间分布理论和估计方法。 ## 1.2研究内容
前言 第1章 地理模型的概念、特点、功能与分类 1.1 地理模型的概念 1.1.1 模型 1.1.2 地理模型 1.2 地理模型的特点 1.3 地理模型的功能 1.3.1 认识地理问题的桥梁 1.3.2 地理科学发现的工具 1.3.3 综合研究的功能 1.4 地理模型的分类 思考题 参考文献 第2章 地理建模的思维导向与原则 2.1 地理建模的思维导向 2.2 地理建模的基本原则 思考题 参考文献 第3章 地理模型建立与应用的若干问题 3.1 建立地理模型的基本步骤 3.2 建立地理模型常用的数学方法 3.3 地理模型的应用方面 3.4 建立与应用地理模型应该注意的问题 思考题 参考文献 第4章 地理建模方法概述 4.1 数据分析法 4.1.1 探索性数据分析 4.1.2 数据分析地理建模实例 4.2 机理分析法 4.2.1 结构分析法 4.2.2 功能分析法 4.2.3 过程分析法 4.2.4 实例:地理过程中的人类活动作用 4.3 量纲分析法 4.3.1 量纲与基本量纲 4.3.2 量纲齐次性原则与相似定律 4.3.3 地理相似准则 4.4 类比分析法 4.4.1 科学发现中的类比分析法 4.4.2 类比法的地理建模实例 4.5 仿真模拟方法 思考题 参考文献 第5章 非确定型建模方法 5.1 经典统计建模方法 5.1.1 统计检验法 5.1.2 相关分析法 5.1.3 回归分析法 5.1.4 主成分分析法 5.1.5 聚类分析法 5.2 空间统计建模方法 5.2.1 空间自相关分析 5.2.2 空间计量模型 5.3 地统计建模方法 5.3.1 地统计方法的基本原理 5.3.2 应用实例 5.4 模糊数学建模法 5.4.1 模糊数学基本知识 5.4.2 模糊聚类方法 5.4.3 模糊综合评判方法 思考题 参考文献 第6章 运筹决策建模方法 6.1 线性规划方法 6.1.1 线性规划的数学模型 6.1.2 线性规划的标准形式 6.1.3 线性规划的解及其性质 6.1.4 线性规划问题的求解方法——单纯形法 6.1.5 应用实例:农场种植计划模型 6.2 目标规划方法 6.2.1 目标规划模型 6.2.2 求解目标规则的单纯形方法 6.2.3 目标规划模型实例:土地利用规划 6.3 网络分析方法 6.3.1 地理网络的测度 6.3.2 最短路径问题 6.3.3 选址问题 6.3.4 最大流问题及其求解方法 6.3.5 最小费用流及其求解方法 6.4 ahp决策分析方法 6.4.1 ahp决策分析的基本原理与计算方法 6.4.2 应用实例:扶贫开发战略决策定量分析 思考题 参考文献 第7章 信息反馈与系统仿真方法 7.1 控制论与信息反馈方法 7.1.1 几个基本概念 7.1.2 地理系统动态的控制论描述 7.1.3 建模实例:可更新资源的最优利用策略 7.2 灰色系统方法 7.2.1 灰色关联分析方法 7.2.2 灰色预测方法 7.2.3 灰色系统建模方法 7.3 系统动力学方法 7.3.1 系统动力学建模的基本原理 7.3.2 系统动力学建模实例:国土资源约束下的区域发展过程 思考题 参考文献 第8章 非线性分析方法 8.1 分形理论建模方法 8.1.1 分形理论简介 8.1.2 分形理论的地理建模实例 8.2 小波分析建模方法 8.2.1 小波分析理论简介 8.2.2 小波分析方法的地理建模实例 8.3 人工神经网络建模方法 8.3.1 人工神经网络简介 8.3.2 人工神经网络方法的地理建模实例 思考题 参考文献 第9章 地理建模分析中常用的软件 9.1 SPSS及相关软件在地理建模中的应用 9.1.1 回归分析 9.1.2 因子分析 9.1.3 聚类分析 9.1.4 SPSS的其他分析功能 9.1.5 其他相关软件简介 9.2 Matlab软件在地理建模中的应用 9.2.1 Matlab主工具箱(matlab main toolbox) 9.2.2 统计工具箱(statistics toolbox) 9.3 Arcgis和Geoda软件在地统计建模方面的应用 9.3.1 Arcgis地统计模块的应用 9.3.2 Geoda的应用 参考文献
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值