白话空间统计三十:地统计(3)区域化变量

自然界的万事万物,都具有空间特征,比如气温、气压、温度、湿度等等。同一时间,不同区域的自然现象在空间上都会显示出一定的结构特性和随机特性。所以当你的观测值随着空间位置的变化,而表现出不同的特征,且呈现出一定的空间分布时,这样的变量,就称之为区域化变量

 

一般情况下,所有的绝大部分的变量,都呈现区域化的特征,比如气温气压,乃至于人均收入购买力等等,比如在风和日丽的18度(平均)气温中出差的虾神,哆嗦在东北一样……

640?wx_fmt=jpeg

 

一般来说,自然形成的各种变量,区域化程度要高于人为设定的物品,比如一个汉堡,北京卖8块钱,两千公里以外的广东也卖8块钱……但是同样是8块钱,不同区域会呈现不同的购买力水平,这又是一种区域化变量特征了。

 

具体来说,什么是区域化变量呢?用白话来回答就是:与空间位置有关的变量。比如:

640?wx_fmt=jpeg

 

就拿温度来举例,任何一个位置,不管你是否去进行测量,温度这个属性都是客观存在的,但是当你没有对它进行实际测量之前,它处于一个随机状态……可以直接看成是在最高温度与最低温度之间的一个随机函数。但是当我们对这个位置进行测量的时候,他的值就被固定下来了,变成了一个具有固定位置和固定测量值的空间点要素。

 

所以地统计学的发明者G.Matheron在早期,给区域化变量下了这样一个定义:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

区域化变量

区域化变量是一种在空间上具有数值的实函数,他在空间上每一个点都会取一个固定的数值,即当一个观测信息从一个点移动到另一个点的时候,函数值是会发生变化的。

 

640?wx_fmt=jpeg

 

位置

划重点要考:只要位置发生变化,函数值就会发生变化的,就是所谓的区域化变量。

 

区域化变量不同于一般的随机变量,他并不是遵循某种概率分布的特点,而是根据空间位置的不同而发生改变的,最显著的特征就是随机变量在同一条件下取值,得到的结果也是有概率不一致的,而区域化变量,在同一位置进行重复观测,如果不发生测量误差(这个内容在讲块金值的时候,还会有详细表情包说明……),得到结果将是一致的。

 

比如传统的随机变量:

640?wx_fmt=jpeg

 

区域化的随机变量:

640?wx_fmt=jpeg

 

 

下面我们来看看区域化变量的一些性质:

 

首先还是用温度来进行说明:

 

640?wx_fmt=jpeg

 

如果两个位置的温度测量值是23 - 19度的话,理论情况下,这两个位置之间的温度应该是线性相关衰减曲线,从23度到19度依次变化。

 

但是实际上温度的变化可能这个样子滴:

640?wx_fmt=jpeg

 

可以看见,虽然整体温度在2319度之间变化,但是并不是严格的线性相关。说明了区域化变量同时具有相关性随机性这两个对立又统一的特性。

 

所以,区域化变量同时具备了两个看似矛盾的性质:

 

  • 结构性。

首先区域化变量肯定是具有一定的结构特性的,比如平均特性,或者线性相关特性,而且就“区域”二字而论,还应该符合所谓的地理学第一定律。

 

(这里说一句:地统计学的起源,要早于地理学第一定律的提出,也早于让空间分析和空间统计学大放异彩的“计量革命”,所以他有很多概念、术语和理论体系,与空间计量学迥然不同,但是又相辅相成。)

 

也就是说,空间任意两个点处的数值,具有某种相关性,这种相关性依赖于两个点之间的与位置有关的向量特征以及观测值的特征。

 

注意,这里说的位置有关的向量,直接可以理解为相对位置,而不是绝对位置:

 

640?wx_fmt=jpeg

 

  • 随机性。

 

区域化变量是一个随机场,具有局部性、随机性、异常性的特征,当空间位置X固定之后,Z(x)就变成了一个随机变量。

 

最后,地统计学的研究目的,与大部分计量科学一样,就是希望用完美的数学来描述自然规律(当然,这也是不可能的,没有最优解,只有次优解)。所以,在研究中,无论是假设还是实际,都默认区域化变量的结构性和随机性具有数学或者统计学上面的意义。

 

当然,在具体的研究中,区域化变量还有下面这样一些意义:

 

比如空间局限性。地统计学认为,区域化变量只出在一定的空间范围内,超出这个范围,表现就很不明显了。(地理学第一定律再次飘过)

 

又比如不同程度的连续性:不同的区域化变量具有不同程度的联系,这种连续性可以通过相邻样本点之间的变异函数来描述,有些变量的连续性强,有些较弱,还有可能是两个非常近的样本值之间的连续性,也非常之弱(在空间统计学里面,认为这些连续性与空间位置强相关,但是地统计学里面,有个专业的研究领域,叫做“块金效应”(Nugget effect),用来描述突然发生的异变,比如矿物的异化,这个在讲块金值的时候,我们再继续)

640?wx_fmt=jpeg

最后,地统计学还有一个各向异性的概念。这个词分解开来,解释如下:所谓的“各向”,是各个方向的简称,“异”表示变异,各向异性,指的就是各个方向上面的变化是不同的——与之相对的,还有一个叫做各向同性,则表示各个方向的变化是一样的:

640?wx_fmt=jpeg

 

各向同性和各向异性通常需要通过区域化变量的自相关程度进行判断,经常采用的方法有变异函数,协相关函数等分析数据的空间分布。

 

实际工作中,各向同性是相对存在的,而各向异性是绝对的存在。

 

在实际研究和应用中,自然界作为一个巨复杂的系统,肯定不能通过几个公式或者几个规律就能描述清楚,区域化变量还有更多的特性,所以用经典的统计学和数学概率的方法进行研究肯定是远远不够的,进行科学研究,大多从高度抽象的层面入手,所以业界提出的具体做法就是先利用简单的空间变异性表达式,并导出求解问题的相容条件和计算方法来。

 

所以,在1960年代,G Matheron提出了空间协方差函数和变异函数。特别是变异函数,它能够同时描述区域化变量的随机性和结构性,使得区域化变量能够从数学意义上拥有了分析和探索的可行性。

 

所以,下一节,我们来简单介绍一下变异函数。

 

待续未完。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

虾神说D

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值