变异函数与变差函数

From: https://baike.baidu.com/item/%E5%8F%98%E5%BC%82%E5%87%BD%E6%95%B0/3737509?fromtitle=%E5%8F%98%E5%B7%AE%E5%87%BD%E6%95%B0&fromid=9070007&fr=aladdin

 

同义词 变差函数一般指变异函数

 

变异函数(variogram)是描述随机场(random field)和随机过程(random process)空间相关性的统计量,被定义为空间内两空间点之差的方差。在实际应用中,由于无法遍历空间内所有点,通过有限个采样计算的变异函数被称为经验变异函数(empirical variogram)。变异函数有时也被称为“变差函数”,在文献中通常记为2γ(s1, s2)或γ(s1, s2),变异函数的一半被称为“半变异函数(semivariogram)”,二者本质相同仅存在简单的倍数关系。变异函数主要应用于随机场和随机过程的建模,在地统计学中,克里金法(Kriging)使用变异函数对空间场进行重构和插值。变异函数在稳定过程(stationary process)中存在许多经典模型,包括块金模型(nugget effect model)、指数模型(exponential model)、高斯模型(Gaussian model)等。

中文名

变异函数

外文名

variogram

学    科

统计学、地质统计学

目录

  1. 定义
  2. 性质
  3. 参数
  4. 建模

定义

编辑

变异函数概念的提出者是地统计学家乔治斯·马瑟伦(Georges Matheron),在其1963年发表的著作Principles of geostatistics中,马瑟伦定义了变异函数 [1]  :

式中

  

为随机场

  

中支撑集

  

内的一个点,

  

  

内任意两点的向量(注:为与其它研究保持一致,这里对原作的数学符号进行了修改)。马瑟伦的定义等价于二阶稳定过程中变异函数的定义,而更一般的变异函数定义如下 [2]  :

式中

  

  

表示数学期望和方差运算,

  

为随机场内特定点的数学期望。

当变异函数应用于二阶稳定过程(second-order stationary process)时,由于随机场的数学期望处处相同,且协方差(covariance)仅与两空间点所构成的向量

  

有关,此时变异函数可表示为:

更进一步地,当变异函数应用于具有各向同性(isotropy)的随机场时,由于协方差仅与两空间点的欧氏距离有关,与方向无关,此时的变异函数可表示为:

变异函数及其有关概念在地统计学中是存在争议的,乔治斯·马瑟伦定义变异函数时,考虑到其计算了成对点

  

间的方差,因而为描述单个点的方差,另外定义了半变异函数 [3]  。但随后“变异函数”和“半变异函数”在地统计学文献中被长期混合使用,对阅读造成了一定困扰 [4]  。有研究指出,变异函数完整具有半变异函数所表达的含义,而与半变异函数对应的概念“半方差(semivariance)”是不符合命名习惯的,因此要避免使用“半变异函数”的称谓。在需要将变异函数的方差值与和通常意义上(与距离无关)的方差做区分时,可以使用“gammavariance” [5]  。

性质

编辑

变异函数的数学本质是二阶(second-order moment),因此恒为非负。且由定义可知,理论变异函数必定经过原点,为偶函数

若随机场的协方差

  

存在,则变异函数与协方差有如下关系:

在二阶稳定过程中,上式可化简为:

此时,变异函数仅是两点间向量

  

的函数。需要指出,该性质的反结论不成立,即当变异函数仅是向量

  

的函数并不能推出二阶稳定过程,满足该条件的随机过程被称为固有稳定过程(intrinsically stationary process) [6]  

参数

编辑

块金(nugget)、基台(sill)和变程(range)是对变异函数进行描述和建模时的常见参数,它们有如下定义 [7]  :

块金:由性质可知,变异函数必定经过原点,如果变异函数在经过原点之后跳跃至其它值,则该值被称为块金。

基台:在二阶稳定过程下,随着距离的增加,变异函数往往趋于平稳,在其呈平稳状态时所达到的值称为基台。如果变异函数在二阶稳定过程下是可遍历的(ergodic),则基台即是该随机过程的方差:

变程:变异函数进入平稳状态时对应的向量长度称为变程,在实际应用中,当变异函数的值达到基台的95%以内时,可被认为进入平稳状态。

建模

编辑

经验变异函数(empirical variogram)

在实际应用中,随机场或随机过程的信息不是出处可用的,只能使用有限个样本点计算经验变异函数

  

,在二阶稳定过程下,经验变异函数有如下表示:

式中

  

为成对样本点

  

的数量。经验变异函数的计算使用离散化

  

,其中

  

是离散化的度量,被称为“跨度(lag)”或“带宽(bandwidth tolerance)”。可以证明,带宽为0时的经验变异函数是对理论变异函数的无偏差估计(unbiased estimator)。因此经验变异函数的代表性取决于可用样本点的数量和分布,充足的样本能够尽可能地缩小带宽,得到更加可靠的计算结果。

应用上式对格点数据进行计算时可有如下步骤:

1.计算所有样本点的距离矩阵(distances matrix)

2.设定经验变异函数的带宽,并将

  

按带宽等分:

 

3. 通过距离矩阵检索点间距离(pairwise distance)在h_i+\delta h内的所有点对,并带入公式计算结果。

4. 遍历所有

  

并重复以上步骤

变异函数模型(variogram model)

二阶稳定过程不必然是各向同性的,依据可用样本点所构成向量的方向分别计算经验变异函数可以观察该随机场是否具有各向同性。具有各向同性的随机场由于所有方向的向量可以共用一个变异函数模型,因此易于建模。一些特定类型的各项异性,例如几何各向异性(geometric anisotropy)可以通过坐标变换转化为各向同性并进行建模。

变异函数模型并不是任意给定的,由性质可知,在二阶稳定过程下,理论变异函数和协方差直接相关(

  

),因此对变异函数建模时,模型必须满足协方差矩阵

  

的正定性质(positive definiteness),即对任意非零向量

  

  

。以下在各向同性假设下给出常见的变异函数模型 [6]  :

块金模型(nugget effect model)

块金模型是对所有距离下的变异函数按定长块金效应建模所得的结果,是最简单的变异函数模型。块金模型下空间所有点的协方差为一常数。

线性模型(linear model)
  

线性模型中变异函数的取值从块金处随距离而增加且是无边界的(unbounded)。因为

  

,所以当空间的距离过远时,协方差可能为负。线性模型无边界的特性使得其只能在特定的距离范围内使用。

幂模型(power model)

幂模型与线性模型一样是无边界的,具有与线性模型类似的性质,只能在特定的距离范围内使用。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值