php大作业_腾讯定位大数据展布与人口密度分析

205cb50fe8b1800d8c451383f207be20.png

1. 数据获取

在假期开始以后,渐渐去尝试学习地理学中一些新型数据获取方式——基于腾讯位置大数据获取城市人口定位数据,这里以山西省(34°34′-40°44′N,110°14′-114°33′)2020年6月30日中午12:00-13:00定位数据为例。腾讯位置大数据(https://heat.qq.com/index.php)顾名思义就是依托腾讯覆盖全球的、高精度的定位技术和数据,目前据腾讯位置大数据页面显示,全球定位服务覆盖超过200个国家,覆盖终端10亿,日请求次数达1100亿次。数据使用的经纬度是腾讯地图使用的火星坐标系,每隔5分钟会更新一次,精度维持在分级(0.01度)。但是比较棘手的是该产品没有历史数据,只能依照需求获取当下的实时数据。

ea87b12f7c1b0d8b08d9056eee900889.png

2. 数据处理

参考知乎大神中原百科的代码,获取这一小时期间的定位数据。由于数据量太大,在Excel的最大1048567行数限制,为了在此不偷偷的忽略一下火星坐标系转地理坐标系的过程,只能分多个xlsx文件进行分别导入。在txt中文件中,它是不同的时间段在表格中叠加,所以还要在Excel中简单的把多余的行给剔除掉。保存、待命。(感受下一千九百万个点的恐惧)

b0baf28a396b145511e7e56f6862af1e.png

3. 数据展布

打开ArcMap,二话不说,直接添加XY数据,这里对于地图学基础不咋样的学生来讲直接进行连接(X对应lon,Y对应lat,随后补一波地图学),然后一定记得添与所用行政区划坐标相一致的坐标系,比方此处添加WGS84,不然后果你懂的……

b0300db5177d89ac5385b22ba2162c22.png

导入之后,可以看出数据量还是相对大的(650M的txt文件,1900多万行,很难想象随着研究区变大会不会处理时候崩掉),趁此机会赶紧导出成shp文件,按位置选择将行政边界中的定位点再次导出(1000万行),得到山西省范围内这一时刻的定位人群数量。

a14211201451c59b02cf2fb22ccfe5ec.png

对于这样的点状数据叠加在一起很难直观看出空间分布的变化,因此使用核密度分析对数据进行进一步处理,核密度分析原理是函数根据点或折线要素计算每单位面积的量值以将各个点或折线拟合为光滑锥状表面,简单的设置一下参数,就完结了。随后可以在属性里依据个人口味调整分析结果的重分类级别和方法,得出自己满意的结果。如果非要给为它起一个专有的名字,我觉得不如称为“山西午饭一小时”。

eba679c61605fbf0ceaf6005930bbe95.png

选择12:00-1:00这个时刻主要是因为大家可能下班打个车、点个外卖之类的,用定位数据还是相对较多的。分析结果与2017人口普查结果误差在10%以内,具有一定的可行性。在软件中最终得到5km*5km默认半径的人口定位核密度分布图,颜色越深,代表区域人口密度越大。作为一名地道山西人呢,看到这样的结果还是能让人微笑点头的。从全省情况来看,活跃人群最多的当属大龙城了,其次是各地级,排名如下:剔尖儿> 揪片>牛肉丸子面>大盘鸡>刀削面>碗托>三合面>剪刀面>面鱼>抿圪斗>莜面栲栳栳。从各地级市尺度来看,人群以各地级市中心为活跃中心,比较特殊的如吕梁市孝义市和离石区人口密度也相对较大。从县级层面来看,人口密度相对集中,应推理为县城中心,而像一些经济发展相对缓慢的县和大面积山脉地区来说,人群活跃相对较少,这也符合人口普查数据公报中的人口分布情况。

把目前自己的几个总结和疑惑留在最后,欢迎各个专业的朋友相互学习相互探讨。

(1)定位人群是不断更新的,通俗来讲也就是说在抓取的时间段内,既可能这一段时间我没有使用定位功能,当然在数据上这个点的count值也就相对的减少,也可能这段时间我多次使用定位,导致这个点的count值相对的增加。这就引出了问题——在某个区域,怎么去选择最合适的时间段来更为精准的模拟区域人群数量?

(2)目前认知有限,关于实时定位的产品有腾讯位置大数据、腾讯宜出行、手机信令、微博签到、高德和百度大数据等等,如何在0.01°的基础上实现更精确的数据获取,然后实现小尺度区域的数据获取,比方具体到一个区,甚至一个学校,还希望有大神能指点一二。

(3)Excel行数有限,怎么处理这样的大量数据最为简便呢?而不是哼哧哼哧的分开作业。

(4)当技术与理论产生耦合时,就发生了火花。用此手段结合目前开放的区域热力图,可以获取多数知名景区的实时游客变化和行为特征,可以为旅游线路规划或是提升服务范围提供建议和参考。在地理学中,用更精细的数据去分析人群流向、分布、特征,对此进行总结与预测,用人的活动去分析对生态、对环境的影响,是现阶段值得一谈的话题。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值