接下来就要进行一些简单的分析了。
今天的目标是如何对某一感兴趣区域进行出租车数据的时空分析。
一、轨迹数据预处理
这一步在上一篇文章中已经有了介绍。
步骤无非就是:
1)使用pandas读取数据
import pandas as pd
import numpy as np
f=open('D:\动态人口分布实验\交通赛数据_上\\20140803_train.txt')
data=pd.read_csv(f,names=['ID','lat','lon','passager','time'])
2)根据轨迹数据的flag列(代表是否为空车),得到flag列变化的行,视为上、下客的位置。然后丢弃无用的列。
data['passager_1']=data['passager'].shift(1)
data['change']=data['passager']-data['passager_1']
data=data.drop(['passager_1'],axis=1)
#索引得到change列为1或-1的列
data=data.loc[(data['change']==1) |(data['change']==