【劲峰论道时空分析技术-学习笔记】5 时空格局和异常探测


整理自 : https://mp.weixin.qq.com/s/VsR0uEt5zEUZb5aZ8t72SA

  • 指事物属性的时空规律性,能够被人类智力理解、掌握和预测。
  • 中国近 3000 个县级行政单元,每个空间单元格中的值 (如 GDP、温度等) 都随时间变化,组成高维数据,超出人脑处理能力。
  • 时空格局分析工具将时空变化信息压缩降维,以二维平面图表达,反映时空格局。
  • 与时空格局相关的概念是景观格局,后者是指大小和形状各异的景观要素在空间上的排列和组合。表现出规律性的景观格局可以称作时空格局。
  • 异常指时空点与其周围时空格局的差别。

SOM时空聚类

  • 自组织映射SOM(Self Organization Mapping)将y(s,t)数据,分类为事先指定的数L=m×n类,其中s,t分别表示空间点和时间点,m、n是两个正整数,其值接近。
  • 具体算法如下:每一类用一个神经元z(k,t)表示,k=1,2,…,L个类型,放置一个m×n二维平面上。
  • 将中国中东部 1456个县市 (s = 1, 2, …, 1456) 2008年5月至2009年3月共11个月(t=1,2,…,11)手足口病和降雨分别进行SOM时空聚类,各分16类,可见中国中东部手足口病和降水的时空类型,发现手足口病高发区在降雨高发区之内。

EOF时空分解

  • 经验正交函数EOF(Empirical Orthogonal Function),也称主成分分析PCA(Principal Component Analysis),将时空数据y(s,t), 其中空间s=1,…,N和时间t=1,…,T,通过坐标变换矩阵将信息即方差*压缩到z(k,t), k=1,…,N和时间t=1,…,T中k的前几项。
  • 下图是中国手足口病的EOF和PC分解,两个模态EOF1和EOF2已解释了原始数据中66%的信息,控制了手足口病时空变异,反映了其时空格局。

在这里插入图片描述

时空热点探测

  • SatScan是当今有代表性的时空热点扫描技术。
  • 对于研究区域ℜ,有时空全覆盖监测数据y(s,t),对于某个时空点(s,t),该时空点的期望发病人数等于整个研究区ℜ的平均发病率乘以该时空点人数,该时空点实际发病人数期望发病人数之比即为该时空点的 OR值(odd ratio);
  • 同样地可以计算该点以外的OR值;
  • 这两个OR值之比即为该时空点的RR值 (relative rate)。当RR值大于1,该时空点患病风险大于其外时空。
  • 逐步扩大该时空点的时空半径,直至覆盖研究区1/2人口,每次计算半径内的实际RR值,取RR值最大的半径作为潜在热点区
  • 将研究区所有时空点的观测病例数在所有时空点上随机重新排列999次,分别计算潜在热点区在这999次病例随机排列下的RR值,降序排列RR值。实际RR值在降序排列RR值中的位次,例如第5位,即为其有别于随机排列的统计显著水平,即0.005的显著性水平,热点高度显著。

多维热点探测

  • 时间—空间—属性多维聚集智能搜索技术。
  • 将研究区域内每个病例都看成一个待聚类的对象,首先不考虑这些病例对象的实际空间位置,只是利用群聚类算法(Ant-based Clustering Algorithm, ACA)将它们根据属性投影到一个二维平面上。
  • 然后在平面上放置若干只人工蚂蚁,每只蚂蚁能随机选择一个病例对象,并计算该病例对象与其周边病例在多维属性值上的相似度,以此来决定是否拾起、移动或放下该对象,通过若干次循环迭代运算后,蚂蚁把属性相似的病例点放在了一起,得到了病例的属性聚类结果。
  • 最后通过判断同一属性聚类的病例点之间的空间邻近关系,以使属性聚类又有了空间聚集性意义。
  • 利用Bayesian Gamma-Poisson模型和过去有关研究区域疫情暴发先验值来计算每个可能存在的传染病聚类成为真实暴发的后验概率以及研究区域存在传染病暴发的可能性
  • 若研究区域内有较大的可能性发生了传染病暴发,那么真实暴发后验概率排在前几位的病例划分就被判定为传染病高发热点区域,并在地图上进行定位。
  • 由于前一步考虑的是病例的“属性—空间”信息,第二步又加入病例发生地以往传染病暴发的时间信息,所以方法得到的最终结果是传染病在“时间—空间—属性”多维度上的聚集。

地球信息图谱

  • 通过人脑对各种信息的直觉和综合分析与逻辑推理,制作地球信息图谱,揭示时空演化所遵循的规律。
  • 例如,淤积海岸带生态系统受地下水位和盐度强烈控制,而地下水位和盐度随距海距离递减呈现有规律的条带状分布 (图2最下部坐标系)。如黄河三角洲和江苏海岸带,受地下水位和土壤盐度空间条带状分布所控制,其上的天然植物、养殖业、种植业的空间分布自海岸线向陆地方向自然演化,呈条带状依次排列。随着淤积海岸向海洋方向不断延伸,可以预测,地点s过去(t-1)是芦苇地,现在(t)是池塘,按照演替规律,未来(t+1)将是稻田。

图2.淤积海岸土地利用演化图谱

  • 时空格局或异常的发现,即可以基于观测数据运用SOM、EOF、扫描和搜索等数值和智能算法,也可以基于专家知识运用地球信息图谱思想的定性方法,还有景观生态学关于时空格局的理论
  • 因输入数据和知识的差异,算法和信息综合方式不同,时空格局的含义有区别。
  • SOM将高维数据按照相似性聚类。如果数据中不存在分异性(strata),SOM将消失。
  • EOF将高维数据按照方差(信息量)分解为几个互相正交的的主要模态以及噪音。如果数据中不存在相关性,EOF将消失。
  • 地球信息图谱揭示时空过程的规律性,给定地点,可以根据图谱定性地预测其状态随时间的变化。
  • 时空热点探测通过比较与周围时空属性值的差异发现异常值,进行预警。
  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值