基于移动通信数据的城市可视分析研究

点击上方蓝字关注我们

基于移动通信数据的城市可视分析研究

王桂娟1,2, 周锐1, 蔡梦杰1, 汤勇2,3, 李茸茸1, 陈华容1,2, 吴亚东4

1 西南科技大学计算机科学与技术学院,四川 绵阳 621000

2 西南科技大学信息工程学院,四川 绵阳 621000

3 四川轻化工大学自动化与信息工程学院,四川 自贡 643000

4 四川轻化工大学计算机科学与工程学院,四川 自贡 643000

 

摘要随着移动电话的深入普及,大规模通信数据给人们提供了前所未有的观测城市微观结构和动态的机会,而如此大规模的高维异构时空关系数据又给高效数据解读带来了挑战。作为重要的大数据分析手段,可视化被越来越多地应用到这一领域。回顾近年来基于通信数据的城市可视分析研究工作,首先归纳了移动通信数据的主要来源、特征和常用的数据处理方法,然后从通信数据的内在对象“人”“通信设备”和“城市空间”3个方面阐述相应的可视化方法,并对基于通信数据的城市可视分析面向的任务、方法和特点进行了梳理,最后对基于通信数据的城市可视分析进行了展望。

关键词通信数据 ; 可视分析 ; 智能城市感知 ; 人类行为模式 ; 城市动态

论文引用格式:

王桂娟, 周锐, 蔡梦杰,  等.基于移动通信数据的城市可视分析研究[J]. 大数据, 2021, 7(2): 32-60.

WANG G J, ZHOU R CAI M J, et al. A survey on mobile communication data based urban visual analysis[J]. Big Data Research, 2021, 7(2): 32-60.


1 引言

移动电话的深入普及给人们带来了前所未有的观测市民流动性的机会,可以利用数据驱动的洞察力更好地规划城市和优化城市服务。目前,全世界93%的人口能够访问移动宽带网络,大部分国家50%以上的人拥有手机,发达国家拥有手机的人数占比甚至达到90% 。通信运营商的计费需求和与通信相关的数据记录需求带来了大量的通信数据。这些数据记录了移动电话用户在通信过程中与基础设施交互的痕迹,可近乎实时地反映手机持有者的地理位置。与传统的基于问卷调查的城市分析相比,通信数据采集成本低廉,具有更大规模、更细的时空分辨率,而且能反映城市的动态变化。通信数据包含的丰富的人与人、人与空间的时变关系信息给城市人类行为研究和城市微观动态研究提供了基础,基于通信数据的城市分析已成为一种重要的城市智能感知途径。

然而,由于城市数据的异构性、高复杂性和大规模性,经常需要在城市分析过程中融合人的感知,这促进了可视化的广泛应用 。可视化将各种类型的数据翻译为相应的可交互图形,使得分析者可以借助高效的视觉通道直观地与数据进行沟通。进一步地,可视分析通过丰富的交互设计让领域专家和分析者有机会参与数据分析的全流程。分析结果的可视化成为人与机器合作的桥梁。可视分析系统的用户能够在不失去全局信息的同时,从多个角度和不同尺度观察数据。因此,许多研究者开始采用可视分析方法解读通信数据中蕴含的丰富的城市信息,这逐渐形成了一个较有成效的交叉研究领域。

本文调研了近年来基于通信数据的城市可视分析方面的研究工作,总结了通信数据的特点,从通信数据城市分析的内在对象——人、通信设备和城市空间3个方面阐述了相应的可视化方法,对基于通信数据的城市可视分析的任务和方法进行了梳理,并对基于通信数据的城市可视分析进行了展望。

2 数据和数据处理

数据是开展可视化研究的基础。通信数据是指人在使用通信网络进行交流和资源访问的过程中产生的记录。通信数据包含的信息可大致分为人、通信设备和城市空间3个维度的时变数据。

2.1 通信数据

从国内外的研究来看,通信运营商是通信领域开展可视化研究最主要的数据来源,通信运营商可以提供通话记录数据、基站数据、移动网络数据等方面的信息。此外,一些研究人员通过招募志愿者,开发特定的手机应用程序或者科研开放项目进行通信数据采集,能够获取更细粒度的数据,如智能手机的事件log、App使用记录。通信领域主要数据的来源、类型、典型属性以及代表文献见表1。同时,在通信数据可视分析中,部分研究结合其他领域数据进行融合和关联分析,如结合社交网络数据、交通数据和兴趣点(point of interest,POI)数据等。

(1)通话记录详单

通话记录详单(call detail record, CDR)是通信领域可视化研究中使用非常频繁的数据之一,CDR数据是通信运营商为了对用户通话进行计费而产生的记录。当用户拨打电话时,接入基站会把该用户的通话记录下来用于计费。CDR记录的信息包括主被叫用户ID、通话开始时间、通话持续时间、关联基站等。国内外研究人员基于CDR数据集开展了大量的通信领域可视化的研究,取得了一系列的成果。Jiang H Y等人通过CDR提取用户行为特征、识别用户关系,基于用户行为特征对运营设施进行优化,能够完成基站选址、基站网络微调等分析任务。Dong Y X等人从CDR数据中检测异常的人群事件。Andrienko G等人利用通话记录开展了人口流动性分析。Mai W M等人利用基于密度的含噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)方法,从CDR数据中提取用户轨迹,挖掘交通特点,描绘关键线路。李艳妮等人基于通话记录数据开发了用户行为分析系统。黄文彬等人分析了移动用户的行为模式,并建立了用户模型,利用K-means进行4类用户划分。向峰开展了移动用户行为研究,研究了移动性对用户关系的影响和城市地理区域的感知。

(2)基站数据

基站数据包含基站编号、基站地址、基站经纬度坐标等信息,对于研究用户的行为轨迹、城市人群流动有重要意义。Li Z H等人利用基站轨迹数据开发了一套城市移动模式可视分析系统,可有效地帮助用户分析移动人群与城市区域间关系的动态变化规律。WANG F等人根据基站实际位置,用Voronoi图划分城市域,从而通过空间结构有效地管理数据。Zhang S H等人基于基站Erlang测量对基站行为进行分析,其观测结果可以用于蜂窝优化、资源规划等。

(3)手机网络数据

手机网络数据是用户使用移动网络产生的记录。Chen L B等人基于网络流量数据进行未来流量预测,提出了一种距离约束互补感知(DCCA)算法,以优化容量利用率和部署成本为目标,寻找最优的基站分簇方案。Sagl G等人从移动网络流量中分析了大规模的集体城市流动行为,有助于更好地理解动态城市系统的“脉搏”。

(4)定制App

在通信数据分析中,有研究采用定制App的方式采集更细粒度的通信网络使用信息。Yadav K等人通过在志愿者手机上安装专门用于数据采集的App,扫描并记录时间戳、MCC、MNC、LAC、Cell ID和RSSI信息;同时,扫描可见的Wi-Fi接入点,并用时间戳记录它们的SSM和BSSID信息,从而研究参与者的行为模式,并和其他数据集进行比对。Slingsby A等人根据志愿者18个月的手机使用情况,探索了参与者的社交关系,提供了一种社交网络的构建方法。

2.2 数据处理

(1)数据清洗

数据清洗是数据处理的第一步。通信领域原始数据中存在大量空间不确定性数据和噪声数据,不能直接进行分析,必须进行数据清洗。对于异常数据,可以设定一定的规则,使用有效性验证的方法进行过滤。对于数据缺失,可以采取删除或者填充的方法进行处理。同时,数据的清洗还包括重复值删除以及数据类型检查等。以最常见的CDR数据为例,可以按照基站位置划分,将用户分配到特定位置,然后根据用户在特定时间段内停留位置的合理性进行数据清洗。

(2)数据校准

基于通信数据的定位服务是通信领域可视化研究的一个重要方面,然而由于手机基站覆盖范围较大、分布不均匀,利用基站获取到的用户行为轨迹精度较低,需要进行数据校准。基站数据需要转换为轨迹数据,按时间顺序聚集每个用户的移动电话记录,然后形成连续的旅行点。使用该方法计算定位点(即记录)之间的时间间隔和空间距离,从而利用时间阈值和空间阈值对定位点进行聚类。同时,也有许多研究者结合基站、网络、Wi-Fi、蓝牙、GPS等数据,利用多源数据融合的方法进行数据校准,从而提高轨迹数据的精度。

(3)数据聚类

通信领域常用的CDR数据属于时间序列数据,不能直接聚类,需要进行特征提取。传统特征提取方法有:基于基本统计方法的特征提取、基于模型的特征提取、基于快速傅里叶变换(fast Fourier transform,FFT)的特征提取。深度学习是时间序列特征提取的新方向。Liu C F等人以手机数据为基础,融合特征提取与聚类分析的方法,对城市结构进行了分析。牛国庄使用模糊聚类算法进行用户行为分析。黄诗瑶使用模糊聚类算法研究用户群体的细分、移动性和群聚现象。

3 通信数据的城市对象可视化

移动通信数据表征用户在何时何地与谁发生了联系,通信数据可视化可以从基础的数据类型和内在的数据对象两个层面刻画通信数据。在基础的数据类型层面,通信数据因包含通话时间和通话地点而同时具有典型的时空特征,可采用时间和空间类型的可视化方法(如采用时间线图、时间流图)表达时间,采用点、线、面地图表达空间信息,采用地理轨迹展示空间的移动性。参考文献已分别从时间序列、地理空间和轨迹分析方面系统地综述了时空可视化的流程、技术和方法,因此本节着眼于通信数据的内在数据对象层面&#

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值