共享单车轨迹数据分析：以厦门市共享单车数据为例（六）

图说交通

已于 2024-09-25 21:45:24 修改

阅读量2.3k

点赞数 42

分类专栏：数据分析文章标签：数据分析数据挖掘大数据 arcgis 信息可视化

于 2024-09-24 20:44:02 首次发布

本文链接：https://blog.csdn.net/weixin_45812624/article/details/142485754

版权

数据分析专栏收录该内容

30 篇文章

订阅专栏

副标题：.基于POI数据的站点功能混合度探究——以厦门市为例（一）

为了保证数据时间尺度上的一致性，我们从互联网上下载了2020年的POI数据，POI数据来源于高德地图 API平台,包括名称、大小类、地理坐标等。并将高德地图 POI数据的火星坐标系 GCJ-02统一转换为通用的 WGS-84地理坐标系，高德地图的POI类别共20个大类，分别为：汽车服务、汽车销售、汽车维修、摩托车服务、餐饮服务、购物服务、生活服务、体育休闲服务、医疗保健服务、住宿服务、风景名胜、商务住宅、政府机构及社会团体、科教文化服务、交通设施服务、金融保险服务、公司企业、道路附属设施、地名地址信息、公共设施，同时，每个大类别都还有二级以及三级的细小划分，具体的POI类别请参考：POI分类编码表

这里选了6大类POI进行分析，囊括了衣食住行，并将部分大类做了合并，把餐饮服务、购物服务、生活服务并称为生活服务，其他包括医疗保健服务、商务住宅、科教文化服务、交通设施服务、公司企业，具体细分项可以参照上面高德的编码表；

我们依然以厦门市为例，来通过POI来研究地铁站点分类，本篇文章研究的范围仅包含厦门的三条地铁线，不包含BRT线路，根据住房和城乡建设部于2015年颁布的《城市轨道沿线地区规划设计导则》，轨道影响区：指距离站点约 500~800 m，所以这里我还是以常规800m影响范围来研究站点分类，这里采用允许缓冲区重叠的方式来形成缓冲区，重叠部分我认为他属于概率事件，他被A地铁站影响的同时也会受B地铁站影响，当然这个属于个人见解，如果需要形成不重叠的缓冲区，详见：ArcGIS应用指南：生成泰森多边形的缓冲区_交通站点以缓冲区范围结合泰森多边形形成的区域共同界定站域边界-CSDN博客；

信息熵用于度量系统的不确定性或混乱程度。本篇文章基于地铁站的功能混合度的背景下，信息熵可以用来度量一个影响区域内不同功能类型的分布情况。具体来说，如果一个区域内的功能类型分布非常均匀，信息熵会较高；如果功能类型分布非常集中，信息熵会较低。

信息熵 H(X)的数学定义如下：

$H(X) = - \sum_{i=1}^{n} P(x_i) \log_2 P(x_i)$

其中：

X是一个离散随机变量。
P(xi)是随机变量 X取值为xi 的概率。
$\log 2$ 表示以2为底的对数，单位是比特

举例说明：

例如，假设某个区域有100个地块，其中30个是居住区，20个是商业区，10个是工业区，40个是绿地公园，则各功能类型的比例为：

居住区：p1=0.3
商业区：p2=0.2
工业区：p3=0.1
绿地公园：p4=0.4

根据上述比例，计算该区域的功能混合度 H(A)：

$H(A) = - (0.3 \log_2 0.3 + 0.2 \log_2 0.2 + 0.1 \log_2 0.1 + 0.4 \log_2 0.4)$

先计算各个项的对数值：

$\log_2 0.3 \approx -1.73697$
$\log_2 0.2 \approx -2.32193$
$\log_2 0.1 \approx -3.32193$
$\log_2 0.4 \approx -1.32193$

代入公式：

$H(A) = - (0.3 \times -1.73697 + 0.2 \times -2.32193 + 0.1 \times -3.32193 + 0.4 \times -1.32193)$

$H(A) =- \left( -0.521091 - 0.464386 - 0.332193 - 0.528772 \right)$

$H(A) =- \left( -1.846442 \right)$

$H(A)= 1.846442$

信息熵约为1.846442比特，表示该区域的功能类型分布较为均匀，功能混合度较高。

接下来，就是数据处理的步骤了，先把POI导进arcgis/arcgispro里面，显示x,y数据，必要的情况下可以把高德坐标系（GCJ-02）坐标转成WGS84，然后把点通过【空间连接】，连接关系选择【一对多连接】，匹配关系选择【包含】，即面包含点；

接下来，如法炮制，我们把每一类POI都进行上述步骤，然后做成一张表格，结果如下，这里我们只对岛内的站点功能混合度进行分析，因为部分站点统计出来的POI总量甚至是个位数的，有些失真，可能是本身该区域POI数量较少，或者数据有所缺失；

岛内（湖里区、思明区）信息熵值最高的前20座地铁站结果如下；

分析

高信息熵站点（信息熵 H(A)H(A) 接近或大于2.0）：
- 体育中心：信息熵 H(A)=2.019H(A)=2.019
- 人才中心：信息熵 H(A)=2.004H(A)=2.004
- 湖滨中路：信息熵 H(A)=2.000H(A)=2.000
- 结论：这些站点的各类型POI分布非常均匀，功能混合度高。这表明这些站点的交通需求多样化，乘客选择不同出行目的的可能性较高。建议继续保持现有多样性，同时关注是否有进一步优化的可能。
中等信息熵站点（信息熵 H(A)H(A) 在1.8到2.0之间）：
- 两岸金融中心：信息熵 H(A)=1.965H(A)=1.965
- 邮轮中心：信息熵 H(A)=1.960H(A)=1.960
- 建业路：信息熵 H(A)=1.911H(A)=1.911
- 湖里公园：信息熵 H(A)=1.884H(A)=1.884
- 小东山：信息熵 H(A)=1.858H(A)=1.858
- 育秀东路：信息熵 H(A)=1.858H(A)=1.858
- 东宅：信息熵 H(A)=1.838H(A)=1.838
- 结论：这些站点的功能混合度较高，各类型POI分布相对均匀。可以考虑优化周边POI布局，进一步增加乘客出行目的选择，提高整体运营效率。
较低信息熵站点（信息熵 H(A)H(A) 在1.7到1.8之间）：
- 观音山：信息熵 H(A)=1.791H(A)=1.791
- 五缘湾：信息熵 H(A)=1.781H(A)=1.781
- 华荣路：信息熵 H(A)=1.777H(A)=1.777
- 将军祠：信息熵 H(A)=1.771H(A)=1.771
- 软件园二期：信息熵 H(A)=1.758H(A)=1.758
- 火炬园：信息熵 H(A)=1.750H(A)=1.750
- 何厝：信息熵 H(A)=1.743H(A)=1.743
- 岭兜：信息熵 H(A)=1.726H(A)=1.726
- 五通：信息熵 H(A)=1.715H(A)=1.715
- 结论：这些站点的各类型POI分布相对不均匀，功能混合度中等。这表明这些站点的功能性比较单一，可能倾向于居住为导向的站点类型或者以上班通勤为导向的站点类型。可以考虑增加这些线路的周边POI类型，提高服务多样性。

结论

高信息熵站点（如体育中心、人才中心、湖滨中路）：这些站点周边的各类型POI分布非常均匀，功能混合度高，交通需求多样化，乘客选择不同出行目的的可能性较高。建议继续保持现有多样性，同时关注是否有进一步优化的可能
中等信息熵站点（如两岸金融中心、邮轮中心、建业路、湖里公园、小东山、育秀东路、东宅）：这些站点的功能混合度较高，各类型POI分布相对均匀。可以考虑优化周边POI布局，进一步增加乘客出行目的选择，提高整体运营效率。
较低信息熵站点（如观音山、五缘湾、华荣路、将军祠、软件园二期、火炬园、何厝、岭兜、五通）：这些站点的各类型POI分布相对不均匀，功能混合度中等。这表明这些站点的功能性比较单一，可能倾向于居住为导向的站点类型或者以上班通勤为导向的站点类型。可以考虑增加这些线路的周边POI类型，提高服务多样性。

参考文献：

1、[1]王焕栋,马红伟.基于站点兴趣点的城市轨道交通站点分类方法[J].交通与运输,2020,36(04):33-37.

2、[2]徐灏铠,黄斌.基于POI数据的厦门市轨道站点影响区功能特征分析研究[C]//中国城市规划学会城市规划新技术应用学术委员会.夯实数据底座·做强创新引擎·赋能多维场景——2022年中国城市规划信息化年会论文集.华侨大学建筑学院;华南理工大学建筑学院;,2022:7.DOI:10.26914/c.cnkihy.2022.031413.

3、[3]郑权一,赵晓龙,金梦潇,等.基于POI混合度的城市公园体力活动类型多样性研究——以深圳市福田区为例[J].规划师,2020,36(13):78-86.
4、[4]张寅桐,郭力娜,郭柳娜,等.基于POI的石家庄主城区城市功能空间特征及混合度评估[J].华北理工大学学报(自然科学版),2024,46(02):84-94.

文章仅用于分享个人学习成果与个人存档之用，分享知识，如有侵权，请联系作者进行删除。所有信息均基于作者的个人理解和经验，不代表任何官方立场或权威解读。