2021FME博客大赛 —— 杭州城市西湖区活力评价

作者:刘松

 

1、前言

1.1研究区简介

杭州是浙江省省会和经济、文化、科教中心,长江三角洲中心城市,重要的风景旅游城市,首批国家历史文化名城。杭州山水相依、湖城合璧,江、河、湖、海、溪五水共导,风景如画,堪称“人间天堂”。

西湖区是浙江省委、省政府的所在地。辖区内有西湖景区、西溪国家湿地公园、西山国家森林公园等优质旅游资源,以及灵山风情小镇、兰里景区等特色景点,绿化覆盖率40.6%、森林覆盖率42.6%以上,拥有得天独厚的自然条件。

1.2研究方法

如何评价城市空间的活力?有很多的专家从很多的维度进行了探索,有些专家从便捷性的角度出发,认为适宜居住的城市空间应该具有良好的可达性(在往期的博客大赛种也有很多相关的作品),也有些专家认为适宜的建设强度与建筑形态、足够的功能混合度是促生城市活力的空间形态基础。那么混合度从何而来,又应该怎么去量化呢?

杭州是历史文化名城,西湖区拥有得天独厚的自然条件。那么现在的西湖区是否有足够的活力?本文将采用FME平台,结合互联网上的资源,用数据的方式对西湖区各区块活力进行一个分析。

研究的思路如下图所示:

 

基于这样的思路,本文将开始对西湖区的活力展开分析。

2、收集数据

数据是分析的基础,本次的分析也不例外。按照思路,本文共需要三种数据,分别是:1、路网数据,2、POI数据,3、行政区划数据。

在收集好各种数据之后,我将使用路网+行政区划数据,来构建交通小区(以下统称地块);使用POI来分析城市的各地块的混合度;并给予此来评估地块的活力。

2.1路网数据

本文中使用到的路网数据,来自于OSM。获取方式为从OSM平台直接下载。

2.2历年POI数据

本次分析使用到的数据为2012-2017年POI数据,数据来源于互联网开放平台。获取方式为从互联网直接下载。

2.3行政区划数据

来自于国内数据厂商:高德。获取方式为:使用FME模板下载。下载模板如下所示:

 

获取逻辑为:1、发请求;2、解析数据;3、纠偏;4、写出。由于数据获取不是本文重点,故不再赘述。

3、处理数据

为了这次研究,我获取到了很多的数据,但这些数据都没办法直接使用。想要把数据应用到研究中,需要进行一些处理。在这一步骤主要完成两项数据处理:1、生成地块数据,2、筛选出研究区POI数据。那么一起来看下我是怎么处理这些数据的吧。

3.1地块数据生成

地块(交通小区)是指由路网构成的不规则网格,地块是承担城市管理和城市规划社会经济功能的基本单元,也是城市区域的自然边界之一。

之所以采用地块而不是画格网来进行分区的原因是:与格网相比,地块内部具有更紧密的联系。一个地块由若干主干道围合而成,可能是一个小区、居民点或者商场,而格网不具有这种特性。因此后续的分析将基于地块进行。

生成地块的思路为:

 

具体的处理流程为:

 

下面来介绍下处理流程中的几个关键步骤。

3.1.1 裁剪路网

从OSM下载的路网数据,并没有按照行政区划进行区分。也就是说:想要得到西湖区的路网数据,需要一些处理。我采用了FME来对数据做裁剪处理。使用FME的Clipper转换器,对OSM的路网进行裁剪后,得到杭州市西湖区的路网数据

3.1.2 挂接道路级别含义

OSM道路数据有自己的一套分类体系,包含了主干道、高速路与各种小路。具体的如下图所示:

 

                                                                                                                                  内容来源于城市数据人

英文部分为OSM数据中的分类信息,还好有人已经整理好了其分类对应的信息(上图)。但这样的内容没办法直接使用,借助FME的能力,我将上面的文本处理成了下图所示的表格:

 

然后使用表格进行挂接,即可按照其中文类型进行道路级别的筛选。

3.1.3 筛选主要道路

使用FME转换器,按照道路级别,筛选出主要道路、高速公路、干道、次要道路四种类型的数据。筛选后的路网如下图所示:

 

3.1.4 地块构建

使用路网与行政区进行拓扑分析,打断相交的面与线,再进行构面操作,最终形成了如下图所示的图层:

 

再通过面积与边长的比,去掉一些狭长面,输出后得到了最终的地块:

3.2 POI筛选

POI数据是各行各业使用比较多的数据。我获取到的POI数据也是全国数据,并没有分区。与地块数据的处理相比POI数据的筛选比较简单,用一个模板截图来说明吧。

 

如上图所示,我使用了FeatureReader结合Where 字句参数来获取历年的数据。使用此方式来进行数据获取,无需读入全部数据,比较高效。

4、分析数据

当数据准备好之后,就到了分析的阶段。

4.1 分析思路

我们首先将POI与地块进行叠加分析,然后再根据公式计算地块的熵值,再加上POI总量及面积指数,最终得到地块的活力指数。

分析的思路为:

 

具体的分析流程为:

下面来介绍下分析流程中的几个关键步骤。

4.2 叠加分析

FME有很多的转换器都可以完成空间数据的叠加分析,在本次分析中,我使用了PointOnAreaOverlayer转换器来完成POI点层与地块面层的叠加分析:

 

在叠加时,将叠加次数存储在ybs字段中,并且为面要素启用列表参数来存储面上的所有点的类别。

4.2.1 混合度计算

在计算混合度之前,先来了解一下什么是熵,什么是信息熵?

4.2.1.1 什么是熵?

 

 

熵,最初是用来描述“能量退化”的物理状态的物质状态参数。但是在很长一段时间内,大家虽然一直都在使用熵,却并没有认清熵的本质。一直到统计物理、信息论等一系列科学理论的发展,熵的本质才逐渐被解释清楚,即:熵的本质是一个系统“内在的混乱程度”。

国内也有专家学者尝试借助“信息熵”的概念来度量城市土地利用的多样性和混合度。

4.2.1.2 什么是信息熵

信息是个很抽象的概念。人们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。

直到1948年,香农提出了“信息熵”的概念,才解决了对信息的量化度量问题。信息论之父克劳德·艾尔伍德·香农第一次用数学语言阐明了概率与信息冗余度的关系。

信息熵计算公式:

HU=-pii=1nlogpi

其中pi为事件i发生的概率。

4.2.1.3 混合度计算

按照熵的计算公式(HU=-pii=1nlogpi)我们来计算一下每块地的熵值。我们每类POI可以看成是同一类型的事件,再把叠加分析后的列表中POI数据进行分析,获取到每类POI所占比例,然后再根据公式计算,即可得到每个地块的熵值(混合程度)。POI本身有自己的分类体系,我使用的西湖区历年POI,涉及到大类23类,中类178类,小类533类。为了更好的体现出科学性,在后续的分析中,我使用最精细的小类来计算熵值。

在实际的计算中,我使用了Python来进行熵值的计算,由于FME对Python的友好支持,使得这个计算非常的简单。

 

需要注意的是,在取对数的计算中,我使用了每个地块内的POI总量做底来计算地块的混合度。

4.2.2 计算POI总量及面积指数

在设计这个指数的时候,充分考虑到与总量相关的面积,我设计了如下公式来计算该指数:

P=k*m/a

其中P为指数,k为常数,m为地块内POI数量,a为地块面积(单位为平方米)。

与熵值的计算相比,借助于FME对四则运算的友好支持,P值的计算要更简单一些:

 

计算方式如上图所示,上图中k值取100。这个值是依经验取的,科学性,还有待验证。

4.2.3 计算活力指数

单纯的依靠熵值,并不能很好的体现出地块的活力。POI数量本身也是一个能够反应城市活力的很重要的一项指标,所以在最终结果中我加入了POI总量与地块面积指数来体现地块活力指数。计算得到的最终数值,来作为地块活力的评价依据。

 

这里的四六开,也是根据经验取的,给POI总量及面积指数较大的权重,是为了凸显其重要性。但这种做法的科学性还有待验证。

4.2.4 批量计算历年地块活力指数

由于使用的数据比较多,在调试好上述功能模板之后,在功能模板的基础上,直接使用批处理方式进行历年地块活力指数的计算

 

 

4.3 分析结果

经过上述计算,最终得到了2012年至2017年的地块活力图。

从上图我们看到,2012年地块活力还属于一般级别(黄色)的部分数据,到了2017年却变成了绿色。其实这不是说这些地块的活力降低了,而是这些地块这些年变化不大,而同区的其他地块发展的太快。放在同一尺度下来看,就好像是这些地块的活力降低了一样。

4.4 总体评价

经过对历年的地块活力图进行观察,发现西湖区活力最高的地块集中在如下图所示的区域:

 

虽然偶有变化,但上图中标出的区域基本上在历年都处于比较高的活力水平。而这个分析结果,跟百度热力图基本吻合,说明这种评价方式还是可行的。

 

4.5 分地块评价

看完整体,再来分地块看一下。

本次选取如下图所示的这个地块作为例子

 

再来查看一下该地块历年POI的情况

 


可以看到,从2015年开始,该地块的POI数量开始显著增加。那么在2015年发生了什么呢?从互联网上的公开资料中,我找到了如下图所示的资料:

 

2015年,该地块迎来了以西溪银泰为代表的一批商业、办公、住宅等类型的POI(一般POI(商业/地产)在项目开始的时候就会出现在互联网地图上,并不是完工了才会出现)。这些POI的到来,反应在地块活力指数上如下图所示:

 

我们可以从上图看到,从2015年开始,其地块活力值发生了数量级的增长,并且总体趋势一致在上升。这与现实情况也是一致的,现在该地块已经变成了集高端住宅、商业、娱乐为一体的高活力地块。

5、总结

5.1 研究存在的不足

由于作者水平及精力限制,本次研究还存在很多的不足。总结起来主要有以下几条:

1)缺少历年路网及POI数据。研究中使用的路网数据是最新的;POI数据也只有2012年至2017年,2017年至今的部分,是缺少的;

2)在计算地块混合度的时候,其实每种类型的POI对地块的混合度影响并不相同。这个很好理解:一所医院跟一个小吃店相比,显然医院对地块的混合度影响更大,但在本次的分析中并没有考虑权重;

3)用POI总量与面积指数结合地块混合度(熵值)来评价地块活力,还处于探索阶段,并没有得到充分的验证;

4)在评价阶段验证的时候使用了现在的百度热力图,来验证2017年的评价结果,在逻辑上不是很严谨。

以上是列出的几条本次研究存在明显不足的地方,由于作者水平限制,本文难免会存在其他不足,敬请各位读者斧正。

5.2 研究的意义

本文从收集数据,到处理分析数据再到得出结论,针对地块活力的量化给出了一套完整比较完整的可行的方案。但各位读者也能看到,评价本身,受制于数据、模型的限制,还存在一些不足,还有很大的改进空间。虽有诸多的不足,但这个评价的结果跟现实还是比较吻合的,这又说明这种方式是可行的。通过本文的探索,希望能给各位带来一些启发。

本文采用的主要数据处理工具是FME,通过这次研究,充分体现出了FME强大又灵活的能力,在数据处理的各个阶段,都能使用FME来进行数据的处理与分析。做数据分析用FME,真香!

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值