1.文章概述
文章是发在part F上的《Understanding user’s travel behavior and city region functions from station-free shared bike usage data》,主要讲述了借助共享单车数据和POI数据对城市用地进行功能区划分。
2.方法论
文章的方法论主要如下所示:
- 对城市土地划分栅格,然后用LDA模型进行城市用地功能区的确定,具体来说是把一个栅格看成是一个document,城市用地性质是topic,然后把栅格内的行为模式作为words。论文原话是:
drawing an analogy between discovering functions of a region and the topic discovery of a document. A region, a function and human mobility patterns are first treated as a document, a topic and words, respectively. A region with multiple functions is similar to a document containing various topics.
于是document-term matrix对应在这个研究中就是说一行代表一个document,一列代表一个某一个时间段的mobility pattern,数值代表该时间段该栅格发生或结束共享单车行程的频次,如下图所示:
2. 通过上述准备工作,就可以进行LDA主题模型分析了,然后得到了每一个栅格属于各个topic的概率,当然这里有一个超参数——topic个数,文章是用Perplexity index这个指标来选取的。
3. 之后把第二步得到的栅格功能区分布,也就是栅格属于各个功能区的概率进行向量特征进行聚类分析,最后就可以得到若干个类别。到这一步,阶段性的工作就算是完成了,每个类可以说是反应了一种共享单车出行模式的用地类型。
4. 前三步其实已经是构成了一个完整的方法论步骤了,文章再次基础上结合POI数据多做了一些分析。首先对前面分析中各个簇中的各类POI频次密度进行统计,然后计算internal ranking以及external ranking,其中internal ranking对一个簇中各类型POI密度进行排序,external ranking对所有的POI密度进行排序,借助POI来对各个类型的功能区进行识别。
5. 在最后文章还用地标建筑和卫星遥感地图做了验证。
参考文献
[1] Chang, X. , J Wu, He, Z. , Li, D. , & Wang, W. . (2020). Understanding user’s travel behavior and city region functions from station-free shared bike usage data. Transportation Research Part F Traffic Psychology and Behaviour, 72, 81-95.