运营商大数据助力复工复产的探索与应用

摘要:随着全国疫情防控工作的有序开展,国内新型冠状病毒的疫情已经进入平稳阶段,然而,企业复工复产对保持经济社会稳定发展至关重要,迫在眉睫。因此,如何统筹疫情防控和复工复产,成为摆在各级政府面前的又一大挑战。国务院联防联控机制发文要求各地“分区分级精准防控,统筹疫情防控与经济社会秩序恢复”。在此背景下,中国联通充分发挥运营商大数据特有的多源、海量、融合的优势,从区域到岗复工率实时洞察、栅格化危险指数评估、区域人口流入风险分析、员工出行方式风险分析等4个方面,助力企业复工复产,为企业决策者制定科学政策提供支撑依据,逐步实现全面到岗复工。

关键词:复工复产;新型冠状病毒;运营商;大数据

一.概述

        在这场举全国之力抗击疫情的“战役”中,各级政府通过暂缓企业开工、学校开课等政策手段,有效控制了疫情的蔓延和发展,当前已初步呈现疫情防控形势持续向好、生产生活秩序加快恢复的态势。然而,企业复工复产对保持经济社会稳定发展至关重要,迫在眉睫。因此,如何统筹疫情防控和复工复产,成为摆在各级政府面前的又一大挑战。2020年 2月 11日,国务院应对新型冠状病毒感染肺炎疫情联防联控机制举行“切实加强疫情科学防控,有序做好企业复工复产”工作发布会。要求各地区分不同疫情状况,在继续加强疫情科学防控的同时,及时协调解决企业的困难和问题,有序推动企业复工复产,尽早恢复正常生产。

      中国联通作为拥有 4 亿用户的电信运营商,充分发挥全国 31 省一点集中的数据优势,面对疫情,快速响应,在保证用户隐私安全的基础上研究开发了一系列大数据疫情防控产品并面向全国部署,为企业复工复产洞察、城市人口动态透视等应用场景提供了数据支撑,确保疫情防控、复工复产的科学有效推进。
      本文主要介绍了运营商大数据在疫情防控趋于稳定的情况下,企业复工复产、学校开工开学等场景的探索及应用。文章组织结构如下:第 2 章对运营商大数据的特征与分析架构进行了介绍;第 3 章阐述了运营商大数据在复工复产背景下的区域到岗率实时洞察与栅格化危险指数评估关注点、区域人口流入与员工出行方式风险点等4个方面的数据分析及研判;第4章对全文进行了总结。

二.运营商大数据技术架构

 

运营商大数据相较于其他行业,有着无法比拟的诸多优势。

      首先,运营商拥有十亿级的出账用户数、PB 级日均数据生成及采集量,数据维度全面包含了用户信息、地理位置、上网行为、历史轨迹、社交关系、支付能力等多元内容,可准确实时地反映用户全息行为状态。

      另外,运营商拥有多张移动网络,全生命周期时间连续、空间完整,在覆盖时间、覆盖范围上遥遥领先于其他行业。运营商大数据可以通过电话号码标识来整合打通各类数据,与 GPS、统计数据等相比,可直接追溯到自然人。通过运营商大数据可以获取用户身份信息、时间信息、位置信息、终端信息、行为信息和感知体验,形成每个用户的动态标签库,从行为轨迹、业务偏好、时空分布、社交属性等维度刻画人们的日常工作与生活。

      中国联通在大数据技术及场景化应用产品研发方面有着多年的技术积累与沉淀,在产品迭代更新上线时,更多的是基于原有的用户标签库、指纹数据库以及场景化分析模型的抽取和组合,快速形成针对不同场景应用的整体技术解决方案,并可以在很短的周期内完成相关产品的模块式开发及上线应用。运营商大数据在助力复工复产方面的应用模型如图1所示。

图1 大数据助力复工复产分析的技术方案

      整体的技术方案,可以分为数据中台层和场景化应用层。

      针对数据中台层的技术方案,主要包含:
      a)数据处理:运营商数据包含23类用户侧及网络侧数据,数据类型包括关系型数据、NoSQL数据等。同时,互联网及垂直行业包含大量的异构数据。数据存储层根据各类数据的采集方式、数据特点制定了一套规范化的数据管理存储体系,实现对以往分散数据的归集与规范化管理,存储能力达到PB级。
      b)模型搭建:针对数据存储层所存储的大量关系型数据、NoSQL数据、异构数据,为了后续进行准确、高效的数据分析,根据各个数据源的不同,研究数据解析与入库方法,实现高效且精准的数据解析,并搭建支撑上层指标分析的机器学习模型。
      c)指标分析:通过搭建 Impala集群、Vertica集群,形成用户和业务为主体的6个基础模块分析。在基础模块之上,数据分析层将进行关联分析,构建用户属性标签库、用户位置档案库,形成用户、位置、驻留时长等分析指标的数据中间层。同时,数据分析层还将引入分布式计算、商业智能 BI 等技术,提升该平台的性能及功能。
      场景化应用层主要包括场景化应用报告及平台服务。在指标分析层以上,搭建地图服务器、GIS 服务器、Web服务器,进而实现数据分析层的用户、位置以及栅格化分析指标的实时查询及地理化呈现,以及针对不同应用场景生成相应的分析报告。

三.运营商大数据助力复工复产

       首先,通过政府公开的媒体网站调研了北京市疫情防控的实时进展情况,截至2020年2月底,北京市疫情走势如图 2 所示。单日新增疑似、新增确诊的病例数均成下降趋势,且趋近于0。

 图2 北京单日新增病例数走势

      同时,通过分析用户浏览微博、新闻等 APP 的业务使用行为,结合互联网公开数据接口,获取用户对疫情的关注程度。基于自然语言处理算法对用户微博、新闻留言等多元文本进行情感研究与分析,可进一步判定用户情绪指数(积极/消极,喜悦/愤怒/恐惧等),关注人群舆论导向。如图3和图4所示,可见公众对疫情的关注度在2020年2月逐步下降,同时公众情绪正在缓慢由消极向积极进行转变。
      从数据分析结果看,截至 2020年 2月底的新冠疫情从医学防控和心理防控2方面整体处于积极向好的稳定局面,这主要得益于常驻人口的自我隔离和迁入人口的有效控制。

图3 //公众疫情关注度变化趋势

 

图4 //公众心理情绪变化趋势

      综上所述,针对大数据助力复工复产的分析应用场景,应重点关注复工复产带来的城市迁入人口变化以及常住人口的隔离变化 2 个方面。因此,本文从区域到岗复工率分析和区域栅格化安全指数 2 个关注点,以及人口迁入分析和员工出行方式预测 2 个风险点等4个方面进行分析及研判。

3.1 关注点 1:区域到岗复工率分析

      运营商数据具备分析用户群体时空信息的能力,通过位置信息、时间戳,可以获取用户的时空轨迹,从而掌握用户出行特征。通过对信令数据的实时分析和用户属性更新,可以逐步形成稳定的用户标签库数据。通过对某特定区域内用户属性分析以及用户数量变化分析,可以实时关注特定区域内的在岗员工到岗复工的变化情况,为企业决策者在制定复工复产相关政策、措施时提供数据分析依据。

      通过用户标签库进行数据筛选分析,针对主语国际周边区域进行分析。通过实时样本数据观测,针对该区域进行详细分析,如图 5 所示,从 2020 年 2 月 25 日—3 月 1 日,周边区域到岗复工比例整体在40%左右,从2020年2月25日—2月28日(周二—周五)单日到岗复工人数持续呈上升趋势。随着国务院相关政策的发布,各企事业单位陆续进入逐步到岗复工的阶段。

图5   区域到岗复工人数变化趋势

      对周边区域人数比较集中的企业、商业楼宇进行个体分析,如图 6所示,楼宇A(浅蓝色)、楼宇B(深蓝色)等单位的到岗复工比例较高,分别为32.2%、31.8%。

图6 区域到岗复工率分析

3.2 关注点 2:区域栅格化安全指数分析

      基于运营商大数据,考虑人口密度、职业群体分布、自我隔离水平、用户出行计划和意图等因素,综合评估城市中各个栅格的危险指数及防疫安全等级(见图 7),并通过可视化平台观测风险预警,可将疫情风险度量化到栅格单位内,为复工复产、精准施策的防疫支撑工作提供参考依据。

      从图 7可以看出,主语周边区域平均安全指数3.75,超越市区54.31%的区域,处于中等水平。同时,在 SEIR 传染病模型中,新增感染人数和潜伏者、传染者、感染者接触到的易感者人数、传染概率、潜伏者转化为感染者概率等因素正相关。因此,高频活动群体成为潜伏者的概率较大,而监测管理该群体,可以有效降低感染者接触到的易感者人数,对于病毒防控有积极作用。

      从数据分析结果看,主语周边区域,频繁进出大中型医院的群体人员,比例较低,基本稳定在0.3%左右。

图7 //栅格安全指数分布

3.3 风险点 1:城市人口迁入风险分析

      受疫情影响,全国大多数城市都推迟了复工日期,因此原本应该在农历初六、七出现的“回流”高峰得到了抑制,整个节后春运期间并未出现明显的集中返程高峰,交通表现相对比较平稳。对比北京市2019年和2020年同期人口迁出情况,如图8所示,截至2020年1月25日前,2020年人口迁出指数与同期相比并无较大差异,但从 2020 年人口迁入情况看,与同期形成较大的对比差异。截至 2020年 2月底,返京人员总量仍处于较低的水平,统计来看,有约 400 万人员尚未返京。如图9所示,从2020年2月15日—2月28日的人口迁入变化分析,单日返京人口数量呈上升趋势,因此,随着逐步复工复产的趋势,北京仍面临大量人口流入压力。

图8 北京市人口迁入迁出对比

图9 安全提示图北京市人口迁入实时变化趋势

阅读全文请关注公众号:通信大数据分析及应用

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值