1.文章概述
文章主要是借助出租车数据对城市出行网络进行分析,包括以下几块:1.对城市出行流进行分类,进而对各种出行流进行了一些描述性统计的分析;2.对各种出行流的模式做了分析,这里模式分析主要采用的方法是得到各种出行流OD距离和方向,然后对每小时的OD流和方向做了离散傅里叶变换(DFT)分析,分析各种出行流的OD流距离和方向的周期性。
文章的方法论上的创新主要是使用DFT分析了出行模式的规律性,其他的分析内容相对较为直观,针对傅里叶变换以及DFT主要可以参考傅里叶变换科普1,傅里叶变换科普2,傅里叶变换公式推导,DFT科普,DFT应用介绍。
2.方法论
2.1 OD聚类
文章第一部分首先对起讫点进行聚类划分。实现这一部分的方法论为:
- 对城市进行1km*1km的栅格化划分,然后统计每个栅格中起点和讫点的trip的数量,生成一个OD矩阵,行的sum就是该栅格作为起点的trip数量,列的sum就是该栅格作为讫点的trip数量。
- 可以人为设定一个阈值,将起点划分为hotspot和non hotspot,类似的,将终点也划分为hotspot和non hotspot。这是最为简单的处理方式,作者提出可以使用聚类的手段,自动确定这个阈值,详见第三步。
- 通过聚类的方式得到一个阈值,将起点和讫点分别划分为hotspot和non hotspot。该聚类方法的优化目标为下式,比较容易理解,其实就是使得这个阈值的划分使得hotspot和non hotspot的区分度最大。
2.2 Repeating patterns in fow displacement(模式分析)
这部分可以说是这篇论文的核心了,这部分分析主要是通过下列方式进行:
- 计算各个流,HH,HN,NH,NN,也就是hotspot->hotspot,hotspot->nonhotspot等等,计算这些流的两个指标,这两个指标计算如下列步骤所述。
- 首先定义每个流的overall displacement vector for each flow type f如下式,xe和ye分别是该flow的每一个trip的经度和纬度方向距离,可以把地图投影到平面,就易于理解,d和w分别是link的距离和trips的数量,需要说明的是这里一小时构建一个网络。
- 得到
V
f
V_f
Vf之后,便可以计算出每个flow的宏观的两个统计指标,下图的这两个指标就相当容易理解,其中
r
f
r_f
rf代表着总体的直线距离,越大说明trip距离越长,
θ
f
\theta_f
θf代表着总的来说这个流的流向。
- 计算得到这两个指标后,由于是每小时构建一个网络,因此得到了一个时间序列,对这个时间序列使用DFT分析,可以进一步分析得到时间序列的周期特性。
具体结果见第三章所示。
3.result
下面展示一下各个方法论对应的结果,只是展示下结果的样子,但是对于具体解读可以去看文章,由于我也没有这么关注具体解读,所以也没有仔细去看了。
4.参考文献
[1] H Hamedmog h adam, Ramezani, M. , & Saberi, M. . (2019). Revealing latent characteristics of mobility networks with coarse-graining. Scientific Reports, 9(1), 7545.