【论文笔记】Mining Association Rules in Spatio-Temporal Data

本文深入探讨了在城市社会经济和土地覆盖变化背景下,如何在时空事务表中挖掘关联规则。通过对时空数据的分析,揭示了隐藏的模式和趋势。
摘要由CSDN通过智能技术生成

Mining Association Rules in Spatio-Temporal Data:An Analysis of Urban Socioeconomic and Land Cover Change


    文章利用关联规则挖掘方法探索科罗拉多州丹佛市的社会经济指标和土地利用变化之间的关系,探讨了怎样从时空数据中挖掘出关联规则,实际上这个研究并没有考虑时间,仅仅考虑了空间上的关系,而且挖掘出来的结果也只是普通的关联规则,不包含空间谓词,更不用说时间谓词了。 (2005年的文章,不能要求太多)
    时空数据挖掘的难点主要在于怎样将数据映射到时间和空间框架上,并且时空数据之间还存在着时间和空间上的自相关。
    文章的重点在于怎样构建时空事务表,也就是挖掘前的数据预处理,时空事务表构建是很重要的。
    现有的对于时空关联规则的挖掘方法有两个:一是不对时空数据进行编码,从时空数据自有的时空框架中间发现时空模式;另一个就是利用传统的关联规则挖掘方法挖掘时空数据,这就有一个问题就是怎样将连续的时空属性数据进行分类分成一些离散的顺序分类值(ordinal categories)。
    文章的时空事务表构建思想是将研究区域划分成若干个相等的网格,计算每个网格的属性值,可以看出根本就没有考虑时间的问题,虽然是以网格为单位计算属性值,但是事务还是以区域多边形为单位的,我认为应该指的是现实中地理上的一个一个区域吧,类似于江夏区、洪山区这些。
    实验用了种族变化率、贫穷率、城镇化率和距最近铁道的距离四个变量作为社会经济指标,以城镇化率为例,计算方法是: 首先生成一个分辨率为30米的二进制网格来表示土地是开发了还是没被开发,然后生成第二个网格,每个单元格里面是距离其1千米范围内已经被开发的网格的数量,最后计算每个多边形中的平均网格单元值。对每一个指标都计算其值,然后对其进行数值的分类,将其转化为离散的数值,分类表如下:

    里面还涉及到一个层次关联规则的问题,因为土地的利用分类从大到小分为了三层,针对于此,做了一个层次的划分,解释如下:在层次一情况下,这些指标值都被分为两类,例如种族变化率在-18到13都是0,13到68是1,层次二情况下,这些指标值被分为四类,层次三情况下,这些指标值被分为八类。
    挖掘方法用的是最经典的Apriori算法,结 果表明:种族变化率比例的上升一般情况下和贫穷的增加有关,这种情况一般不怎么在经历过发展和正在持续发展的地区出现。然而在非常城市化的地方中正在发展的区域,其他种族人群比例的上升和贫穷的增加是相关的;在非城镇化的地方中正在发展的区域不符合这种规则,有一个例外就是这些区域离铁路线近的话,就符合上述的规则。在发展中的区域,城镇和偏远区域对于种群/贫穷的关系就没有那么强烈。
    思考:时空事务表的构建目标是为了计算研究目标上的属性取值,时间和空间到底怎样划分某种意义上来说就是一种插值的方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值