地学计算方法/地统计学(第二章地理数据及其采集与预处理)

本文详细介绍了地理数据的类型、基本特征和采集处理过程,包括空间和属性数据、数据的不确定性、多尺度性以及多维性。在数据预处理阶段,涉及统计整理、正态分布检验和数据转换,如平均值、中位数、离散程度指标等。此外,文章还讨论了异常值的识别和处理方法,以及相关分析和回归分析的基本概念。
摘要由CSDN通过智能技术生成

2第二章 地理数据及其采集与预处理

2.1地理数据类型

  • 空间数据:用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围及空间联系,包含有点、线、面,点线面之间的拓扑关系。
    在这里插入图片描述
  • 属性数据:用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征

数量标志数据
间隔尺度数据:以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。

比例尺度数据:以无量纲的数据形式表示测度对象的相对量

品质标志数据

有序数据:当测度标准不是连续的量,只是表示其顺序关系的数据

二元数据:用0、1两个数据表示地理事物、地理现象或地理事件的是非判断问题

名义尺度数据:用数字表示地理实体、地理要素、地理现象或地理事件的状态类型

2.2地理数据基本特征

  • 数量化、形式化、逻辑化:定量化的地理数据是建立地理数学模型的基础,其作用为:确定模型的参数、给定模型运行的初值条件;检验模型的有效性。形式化、逻辑化与数量化,是所有地理数据的共同特征。
  • 不确定性:地理系统本身的复杂性从本质上决定着地理数据的不确定性
  • 多种时空尺度:从空间尺度上来看,描述地理区域的各种地理数据,具有多种空间尺度——既有全球尺度的、洲际尺度的、国家尺度的,也有流域尺度的、地区尺度的、城市尺度的、社区尺度的,从时间尺度上来看,描述地理过程的各种地理数据具有多种时间尺度,如历史年代、天、月、季度、年等
  • 多维性:一个地理对象的具体意义要从空间、属性、时间三个方面综合描述,空间方面,描述该地理对象所处的地理位置和空间范围,一般需要2~3个变量,属性方面,描述该地理对象的具体内容,至少需要1个以上,多则需要十几个、甚至几十个变量,时间方面,描述该地理对象产生、发展和存在的时间范围 ,需要1个变量,地理数据的多维性,被描述为地理数据立方体。(the geographical data cube)

2.3地理数据的采集与处理

2.3.1地理数据采集

地理数据的渠道来源
①来自于观测、测量部门的专业数据。
②来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据。
③来自于有关单位或个人的不定期的典型调查数据、抽样调查数据。
④来自于政府公报、文件中的有关数据
⑤来自于档案、图书等文献资料中的有关数据。
⑥来自于互联网(Internet)的有关共享数据。
⑦来自地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。
⑧来自遥感数据。主要包括各种航空遥感数据和卫星遥感数据。
⑨其他来源的有关数据。
采集地理数据过程中需要注意的问题
①数据的完备性和可靠性。
②在数据采集过程中,最大限度地减小数据的误差。
③在数据采集完毕后,进行检验,辨别真伪,通过数据筛选,去粗取精、去伪存真

2.3.2地理数据处理

地理数据处理,是地理问题研究的核心环节。
从理论上讲,在地理学中,数学方法的运用主要有两个目的:(1)运用数学语言对地理问题的描述,建立地理数学模型,从更高、更深层次上揭示地理问题的机理;(2)运用有关数学方法,通过定量化的计算和分析,对地理数据进行处理,从而揭示有关地理现象的内在规律

2.4地理数据的统计预处理

2.4.1统计整理

①统计分组,就是根据研究目的,按照一定的分组标志将地理数据分成若干组。
②计算各组数据的频数、频率,编制统计分组表。
③作分布图。

2.4.2几种常用的统计指标与参数

2.4.2.1描述地理数据一般水平的指标

平均值未分组 x ˉ = 1 n ∑ i = 1 n x i \bar{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i} xˉ=n1i=1nxi 分组 x ˉ = ∑ i = 1 m f i x i ∑ i = 1 m f i \bar{x}=\frac{\sum_{i=1}^{m} f_{i} x_{i}}{\sum_{i=1}^{m} f_{i}} xˉ=i=1mfii=1mfixi

中位数未分组排在中间的位置

分组 M e = L + d × 1 2 ∑ i = 1 n f i − S m − 1 f m M_{e}=L+d \times \frac{\frac{1}{2} \sum_{i=1}^{n} f_{i}-S_{m-1}}{f_{m}} Me=L+d×fm21i=1nfiSm1 M e = U − d × 1 2 ∑ i = 1 n f i − S m + 1 f m M_{e}=U-d \times \frac{\frac{1}{2} \sum_{i=1}^{n} f_{i}-S_{m+1}}{f_{m}} Me=Ud×fm21i=1nfiSm+1

M e M_e Me代表中位数;
L L L为中位数所在组的下限值;
U U U为中位数所在组的上限值;
f m f_m fm为中位数所在组的频数;
S m − 1 S_{m-1} Sm1为中位数所在组以下的累计频数;
S m + 1 S_{m+1} Sm+1为中位数所在组以上的累计频数;
d d d为中位数所在组的组距

众数:未分组 频数最大的 分组 M 0 = L + d × Δ 1 Δ 1 + Δ 2 M_{0}=L+d \times \frac{\Delta_{1}}{\Delta_{1}+\Delta_{2}} M0=L+d×Δ1+Δ2Δ1 M 0 = U − d × Δ 2 Δ 1 + Δ 2 M_{0}=U-d \times \frac{\Delta_{2}}{\Delta_{1}+\Delta_{2}} M0=Ud×Δ1+Δ2Δ2

M 0 M_0 M0代表众数;
L L L为众数所在组的下限值;
U U U为众数所在组的上限值;
Δ 1 \Delta_1 Δ1为众数组频数与上一组频数之差;
Δ 2 \Delta_2 Δ2为众数组频数与下一组频数之差;
d d d为众数所在组的组距

计算举例

平均数:
x ˉ = ∑ i = 1 m f i x i ∑ i = 1 m f i = ( 300 ∗ 2500 + 1300 ∗ 3500 + 200 ∗ 4500 + 150 ∗ 5500 + 100 ∗ 6500 + 50 ∗ 7500 + 30 ∗ 8500 ) / 2130 = 3899.06 \bar{x}=\frac{\sum_{i=1}^{m} f_{i} x_{i}}{\sum_{i=1}^{m} f_{i}}\\ =(300*2500+1300*3500+200*4500+150*5500+100*6500\\ +50*7500+30*8500)/2130=3899.06 xˉ=i=1mfii=1mfixi=(30025

  • 49
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值