大数据 防范脱贫人口返贫_面向国土空间规划编制的多源人口大数据模型研究...

本文探讨了在大数据背景下,如何利用手机信令和互联网位置服务数据,结合传统统计年鉴数据,设计多源人口大数据模型,辅助国土空间规划编制。通过对人口规模、结构、职住平衡、人口流动等方面的分析,展示了模型在人口评估中的应用,为城市精细化治理提供决策支持。
摘要由CSDN通过智能技术生成

3793d22747c8b0c119e502c088caa5de.png
本文已发表于微信公众号:中国国土空间规划

导读

在国家大数据战略与新一轮国土空间规划编制等工作的背景下,大数据从数据支撑、分析方法、决策支持等方面为新一轮的国土空间规划编制提供了新的解决方案。其中,人口底数往往对一个地区的经济产业发展具有举足轻重的影响,人口流动监测在空间要素配置、公共应急预警等方面扮演重要角色,人口规模与特征则是城镇体系规划、产业空间布局规划及职住平衡分析的基础工作。利用传统的调查手段获取的人口基数与流动情况不仅耗资巨大,且难以支撑精细化的人口分布、人口结构与人群活动等分析。本文通过总结相关空间规划项目中人口模型的研究经验,融合传统人口数据、手机信令与互联网位置服务数据等多种人口大数据,设计并实现了多空间尺度与多分析角度的人口评估大数据模型,以辅助国土空间规划编制业务。

af374028b8d37b8e7b1581123a02f3c0.png

1、 数据支撑与技术路线

1.1 数据支撑

手机信令数据

手机信令数据是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录同一用户信令轨迹所产生,最后经过脱密、脱敏、扩样等处理后可用于居民行为偏好、移动轨迹分析、城镇空间布局等研究。手机信令数据具有样本量大、时空连续性、更新速度快、与自然人关联等优点,是用于研究城市居民行为与空间分布较好的数据源。

fac996bee2589b02a8f9a6d7bfb1eaec.png
手机信令数据捕获方式

互联网位置服务数据
互联网位置服务数据主要来源于百度、高德、腾讯等地图开放平台,基于GPS、基站和WiFi共现信息实时获取用户海量时空定位大数据,具有精度高、覆盖广、更新快的特点,是研究人口画像、人口流动、职住关系、交通流动的较好数据源。

b888851ccf5cf4c6a01094646da80a96.png
互联网位置服务数据采集模式

数据对比

综合分析手机信令、互联网位置服务数据与统计年鉴的数据特点,从指标种类、数据精度。空间范围、数据准确性、更新频率、数据可视化六个维度进行对比分析。其中手机信令数据从定位精度、数据范围、准确性与更新频率表现更佳,互联网地图厂商从指标种类与数据可视化能力更加突出。

03f70560c0e906e92127d57d9d13c6b3.png

1.2 技术路线

基于手机信令数据、互联网位置服务数据、统计年鉴的多源人口大数据,在经过脱密脱敏、坐标转换、格式转换等数据预处理后,针对不同类型人口专题模型分析的需要,结合特征识别、时间序列分析等大数据分析模型进行计算,最后得到人群画像、人口结构等多种视角的分析结果,将结果进行对比分析,为区域、城市空间布局与发展战略提供决策依据。

2a4aea13dc4e5bfed2f25fa3946564c7.png

2、多源人口大数据模型的设计2.1 特征识别

基于手机信令的大样本数据,运用Hadoop分布式集群构建海量数据特征提取算法,识别出手机用户在一定范围内的驻留行为,结合驻留行为发生的时间,筛选出用户的职住地、休闲地或兴趣区域。

2f8a580042323d861ebe9aa3661580ad.png
手机信令特征识别核心内容

2.2 时间序列分析

基于一段时间的人口动态数据应具备一定的平稳时序变化规律,例如一天周期内的商务集中区应在工作时间达到人口数量峰值,在下班休息时间达到人口数量低谷,形成以日为周期的潮汐现象。针对不同区域构成多组时间序列样本,通过建立ARMA模型(自移动平均回归模型),并计算自相关系数(ACF)与偏自相关系数(PACF),可用于预测短期且平稳的区域人口变化情况。

96ded2bb6c0862a00f5be8c198b1c79c.png
时间序列分析流程图

2.3 聚合分析

人口分布与人口流动目的地的空间位置一般具有一定的集聚分布或随机分布规律,在数据量巨大而且不进行抽稀、去项等操作的情况下,难以得出比较直观的分析结果。采用大数据点聚合分析方法,在分析区域内进行大量点要素的聚合分析,得到区域内聚合中心及其属性的总和、最小最大值、方差、标准差、平均值等统计数据。

bfc50a170c2659b028782c7a11b9957b.png
人口分布聚合分析示意图

3、多源人口大数据模型的实现

基于多源人口大数据模型中的基本算法与人口评估的具体需求,以下对城市的人口规模、人口结构、职住平衡、人口潮汐、人口流动、旅游分析、产业分析、公共服务分析八个方面进行了模型实现与分析。3.1 人口规模

根据人口标签的基本定义和手机信令特征识别方法,识别工作日工作时间频繁出现在某一地点的工作人口,识别晚上休息时间长时间在某一地点驻留的居住人口,识别包括常住人口和3天以上、半年以下短期驻留人口总和为实际服务人口。本研究基于手机信令构建人口规模评估大数据模型,汇总统计了多个城市的工作人口、居住人口和实际服务人口规模(如下图所示)。

f4d8461a49d78a4c96054e542142ed07.gif
工作人口

21fb7c9a5106f808d2023a226848e701.gif
居住人口

09cf676707fd470117b10d63992db483.gif
实际服务人口

3.2 人口结构

人口结构主要包括人口性别、人口年龄、人口学历、人口就业、人口收入等方面,不同人口结构的模型构建思路基本一致,本研究选取某市的人口年龄结构为研究对象,分析结果如下图所示。综合分析各区域人口年龄结构发现,该城市19-24岁人口占比最大,属于比较年轻化的城市,而60岁以上人口超过区域总人口10%的区域占11/14,根据国际标准来判定具有一定的老龄化风险。

e380933baf2fa8cbe6e77201060e8e55.png
人口年龄结构(单位:%)

3.3 职住平衡

城市内部普遍存在一定的职住分离现象,在识别手机用户工作地与居住地归属的基础上,统计城市内部各镇街间的发生职住通勤OD人口数量,分析职住分离规律。以某市为例,根据行政区性质将城市分为8个区域,从人口密度来看位于城市中心的B、C区域人口分布最密集,而在城东西两侧A、E、H区域与市中心区域的职住联系度最高,并在核心区形成了比较明显的人口集聚现象。

3795381e4c09e58ceb3020c6b5a75850.png

利用职住比模型测量区域职住关系,其计算公式如下:

1bcae104d4a7fc094f2a37f521dc3cb4.png


Pe是研究单元就业人口数,∑Pt是研究区总就业人数,Le是研究单元居住人口数,∑Lt是研究区总居住人数。一般认为,职住比指数JHR在0.8-1.2的地区属于人口居住-就业平衡区;JHR大于1.2说明该地区就业岗位数大于区域需就业人口数,属于就业导入型;JHR小于0.8说明该地区就业岗位数小于区域需就业人口数,属于就业导出型。
本研究综合手机信令和互联网位置服务数据,从镇街空间尺度展开分析,该研究区仅有3个镇属于就业导入型,11个镇为就业导出型,其余为就业平衡型,因此可基本判断研究区职住情况偏向于就业导出型。

15722068fdcfe92ce9b287bff8970ee5.png

3.4 人口潮汐

基于手机信令的人口分布数据,以小时为时间变量,以一天为分析周期,并在网格尺度聚合采集的信令点数量,分析区域内人口潮汐变化规律,形成统计分析结果。

f2bf803b35aea9be76c72dbf7b31482e.gif
城市人口分布

选择城市五个典型区域进行时间序列分析,其中B区域与D区域出现了一定程度的工作时间“涨潮”现象,即9:00-18:00出现信令数量增长,早晚两极出现信令数量回落现象,而该区域是商务办公区比较集中的城区,是工作人口相对集中区域,而其余三个区域则表现比较平稳,推断出A、C、E区域是职住分布相对比较平衡的区域。

fb4ba618ed404e552443a9d03cc80c7e.png

3.5 人口流动

统计各市之间一个月跨市出行的人流量,并根据以下公式得出各城市对外日均人流联系量:

58d4fb14e0215a451e84ce84952bb008.png

上式中:Ni 表示 i 城市对外日均人流联系量(万人次/天)的指标结果值,Oi 表示以 i 城市为出发地的OD记录,j 表示第j 条OD记录,T表示统计天数。
从研究区分析结果可知,城市间人口流通量最高的五条城际OD线路中,有四条线路是A市及其相邻的四个城市,还有一个OD是G市与H市之间形成,说明A市的吸引力较高,在研究区的人口辐射能力较强。

162a5e579069195e0476effe6f1c8f00.png

3.6 旅游分析

以地级市为基本统计单元,提取手机用户号码归属地不属于本市的用户,将用户的信令数据的驻留行为(在某个基站范围停留超过30分钟)与出行行为(在某个基站范围停留不超过30分钟)结合,形成连续的人口流动OD,分析十一黄金周八天假ABCD四个热门旅游城市的流入人口分布地及流入数量。

黄金周旅游人口流入量

6c81a4a005e00d9ee7c8ad6d767f5f56.gif
A市

bc2823e8965a8616a77871f79863043f.gif
B市

362167d1cf2a445218fb459459bcbf3d.gif
C市

9d8516b4ce300f42ff33c41458157de3.gif
D市

通过汇总统计分析四个城市的游客来源地发现,国庆黄金周到达四个城市的流入地Top10城市分布以相邻的东侧城市为主,总流入量均超过20万人次,其次为北侧距离较远的几个城市,而旅游地以A市与B市最受欢迎,日均游客访问量都超过30万人次。

5143aa8e070e3d5d0eed614ecc7ead64.png
(Oi代表游客来源地,A-D代表目的地)

3.7 产业分析

为了分析各类产业就业状况,对工商企业进行地址解析后,叠加手机信令数据提取的工作人口空间分布与区域内各类企业数量,计算各类产业就业人口。

a75b92762b9eda4b641512476b019c46.png

8e9e0adb8bfa70ff552876e411b498c0.png

3.8 公共服务分析

以手机信令和POI数据为核心数据,分文教体卫四种公共服务设施展开分析。各类设施分析方法类似,以教育设施的小学为例,根据我国《城市公共服务设施规划标准》,当千人学位数为60-80个,小学的规模为36个班时,每所小学的服务人口为27000人。统计各个镇街行政区现有某类教育设施数量,计算现有某类教育设施的服务人口,将某类教育设施的服务人口与根据手机信令数据提取得到镇街行政区实际服务人口之差,即为某类教育设施供需缺口。

2ad665cd818d3aec1d606f7767f70ba6.png

4、系统应用集成

结合多源大数据在人口评估的各项应用,集成到国土空间规划“一张图”实施监督信息系统中对动态监测、及时预警和定期评估的分析模型中,并实现指标模型管理和灵活配置,为国土空间规划编制、实施、监测、评估、预警等提供模型计算支撑。

29e8c09b4ffd7f2524a95b50a5b0aa00.png
系统应用集成

五、结论与展望

在城市精细化治理与空间大数据应用的背景下,包括运营商、互联网公司、APP采集商、定位服务应用等反映人口行为特征的多源大数据未来将与空间规划、城市管理、消费购物等领域深度融合,以数据+算力+算法+可视化展示构建各种行业应用。除了运营商与互联网平台的人口大数据以外,包括POI数据、移动APP数据、旅游平台数据等基于位置的多源大数据也可在旅游客源标签分析、综合交通体系运行、城市功能区识别等应用方向发挥作用,而在2020年春节爆发的新冠病毒疫情防控中,手机信令、互联网实时大数据等方法也可应用于人口活动轨迹、重点人群流向实时、快速、精准的监测。部门简介:大数据中心是国地科技信息化产品与智慧城市建设的技术支持部门,负责信息化产品功能研发、前沿技术与科技课题研究,可提供自然资源与城乡空间规划建设管理信息化一体化解决方案,并致力于推动大数据、人工智能、城市信息模型等新型信息化技术从智慧规划到智慧城市的实践应用。以专业和创新提供一流的行业信息化和智慧城市建设全流程服务。

责任编辑:林冬娜、邓小云︱文章审核:张鸿辉、洪良

点击→→智慧国土空间规划全流程解决方案,可查看本系列更多内容。

想了解更多相关行业资讯,欢迎关注国地科技旗下的公众号→「 国地资讯 」(ID:guodizixun)、「 空间规划大数据联盟 」(ID:kjghdsjlm)
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值