读书笔记《Outlier Analysis》 第十一章 空间数据的异常检测

1.引言

空间数据是一种上下文数据类型。

空间数据有两种类型的属性:

行为属性:

这是为每个对象测量的感兴趣属性。例如,这个属性可以对应于海面温度、风速、车速、疾病爆发次数、图像像素的颜色等等。

在给定的应用程序中可能有多个行为属性。因此,在许多应用程序中,这个属性是非空间的,因为它测量给定位置的一些感兴趣的数量。然而,在一些数据类型,如轨迹,行为属性是空间的。

上下文属性:

在许多空间数据类型中,上下文属性是空间的,尽管在某些偶然情况下(例如上下文是时间的轨迹)它可能不是空间的。海面温度、风速和车速通常是在特定空间位置的背景下测量的。空间上下文通常用坐标表示,坐标通常对应于两个或三个数值。在某些情况下,上下文属性可以以感兴趣区域的粒度表示,例如县、邮编等。

空间数据和时间序列数据在上下文数据类型方面有许多相似之处。事实上,空间和时间属性往往发生在行为和上下文属性的各种组合中。这种数据也称为时空数据。例如,飓风跟踪,上下文属性都是时间和空间属性。

有一个特别不寻常的情况是在轨迹数据中,行为属性是空间的,而上下文属性是时间的。 因此,很明显,可以根据空间属性是上下文属性还是行为属性来捕获不同类型的语义和应用程序。

一般来说,空间数据有两个关键设置

空间属性是上下文的:在这种情况中,在不同的空间位置测量一些感兴趣的数量。通常可能还有其他上下文属性。例如,时间属性可能是时间性的。在这种情况下,人们可能有兴趣根据潜在的动力学来确定重要的时空异常(或事件)。例如,行为属性的动态,如湿度、风俗、海面温度和压力,可以用来识别和预测异常天气事件。

空间属性是行为的:最常见的例子是轨迹数据。事实上,轨迹也已看作是多元事件数据的特里。例如,二维实时轨迹挖掘应用程序可以被建模为一个二元事件序列,其中X坐标和Y坐标是每个时间序列。

在空间属性是上下文的情况中,异常值是与周围空间邻近具有非常不同的行为属性值的对象。

因此,空间连续性在异常识别中起着重要的作用,就像时间连续性在事件序列异常检测中是重要的一样。

空间连续性的基本原则:一切都与其他一切有关,但附近的物体遥远的物体更有联系。

在空间属性是行为的情况中,上下文属性通常是时态的。这对应于轨迹数据,这是多元数据序列的一种形式。

 

空间应用的一些例子:

气象数据:在不同的地理位置测量了许多天气参数,这些参数可用于预测基础数据中的异常天气模式。

交通数据:移动对象可能与许多参数相关联,如速度、方向等。在许多情况下,这种数据也是时空的,因为它具有时间成分。发现运动物体的异常行为可以提供许多洞察力。例如,发现异常的出租车出行可以用于发现不诚实的司机。

地球科学数据:不同空间位置的土地覆盖类型可能是行为属性。这种模式中的异常提供了关于人类活动异常趋势的见解,如砍伐森林或其他的异常植被趋势。

疾病爆发数据:有关疾病爆发的数据通常由地理位置汇总。这种数据的异常趋势可以提供关于爆发因果关系的信息。

医学诊断:磁共振成像MRI和正电子发射断层扫描PET是二维或三维空间数据。在这些数据中检测不寻常的局部区域可以帮助检测疾病。

人口数据:人口属性,如年龄、性别、种族和工资,可用于识别人口异常。这些信息可以用于目标营销应用程序。

 

与时间数据一样,违反空间连续性的行为属性的突然变化被用来识别上下文异常。

在时空数据中,利用时空连续性进行建模。例如,在一个小的局部区域,少数汽车的速度突然变化可能意味着事故或其他异常事件的发生。

 

在异常检测算法中,空间数据有两个主要特征:

空间自相关Spatial autocorrelations

这与空间邻域中的行为属性值相互密切相关的事实相对应。然而,是时间数据不同的是,时间序列的未来值是未知的。可以使用数据点的所有空间方向上的值。请注意,空间自相关完全类似于时间序列自回归AR模型中所利用的时间自相关。

空间异方差Spatial heteroscedasticity

这对应于行为属性的方差取决于空间位置这一事实。

 

大多数关于空间异常值的工作都是关于发现违反空间自相关的突变。这些异常值是上下文异常值,很多文献也提出了方法。它们中的主要属性使用邻域内行为属性的变化来定义异常值。这些异常值使用多维分析方法或基于图形的方法。许多时间自相关方法也可以推广到空间域。

与时间序列数据库一样,在多个空间分布数据库中找到不寻常的行为属性模型形状也是有用的。

监督方法在空间领域也非常有用,在空间领域,从多个空间模式中确定不寻常的形状是可取的。

时间和空间异常检测之间存在着密切的关系,因为这两种方法都使用行为属性连续性的概念来处理一个或多个上下文属性。主要区别在于空间上下文属性往往是多维的,而时间是单一的属性。此外,时间是单向的,而空间属性通常在所有轴的不同方向上已知。

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值