TransBigData工具针对时空大数据处理而开发,依托于GeoPandas。TransBigData集成了交通时空大数据处理过程中常用的方法。包括栅格化、数据质量分析、数据预处理、数据集计、轨迹分析、GIS处理、地图底图加载、坐标与距离计算、数据可视化等通用方法,面向交通时空大数据分析不同阶段的处理需求提供不同处理功能,代码简洁、高效、灵活、易用,通过简短的代码即可实现复杂的数据任务。
延伸阅读
TransBigData 针对交通时空大数据处理的Python包
今天我们尝试利用TransBigData这个第三方库实现对公交地铁数据的爬取。
爬取公交地铁线路需要用到TransBigData第三方库的getbusline的方法输入城市跟公交或地铁线路名称的关键词,即可获取到线路数据,坐标系为wgs84。
我们以南京地铁为例,进行数据爬取
import transbigdata as tbd
line,stop = tbd.getbusdata('南京',['1号线','2号线'])
我们通过line和stop分别获取地铁线路和沿线站点相关信息,格式如图所示
我们分别对线路和站点进行可视化,即可得到下面两张图
line.plot()
stop.plot()
接着我们尝试一下,爬取一下公交线路
import transbigdata as tbd
line1,stop1 = tbd.getbusdata('南京',['1路'])
line2,stop2 = tbd.getbusdata('南京',['2'])
尝试输出一下line1和line2,分别得到以下结果
线路和站点可视化过程同上
以后爬取公交地铁数据可以尝试着用一用这个包呢。
参考链接
TransBigData 针对交通时空大数据处理的Python包
Python地铁数据爬取和拓扑建模(TransBigData)