利用Python数据处理进行公交车到站时间预测(一)

本文介绍了如何利用Python对公交车到站时间进行预测。首先,详细解析了数据格式,接着进行了数据清洗,删除无效数据并按上下行分类。然后,通过分析数据,计算了相邻站点之间的行驶间隔,并处理了时间数据,最终处理了异常值,为预测模型准备了数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.数据格式

id  int  id编号
type  int   41表示站间数据,42中间站进出数据 43始末站进出数据
route_id int  线路ID号,10454,10069,120881
bus_id  varchar  车辆编号
station_id varchar  站点编号
lon  decimal  经度
lat  decimal   纬度
speed  decimal  速度
direction decimal  方向
gpsflag  int  gps状态  0有效,1无效
updownflag int  上下行,0上行,1下行
inoutflag int  进出站,0进站,1出站
runningflag int  运营状态,0正常运营,1停止运营
onlineflag int  在线状态,0正常状态,1不在线
create_time timestamp  gps时间

共十五个字段,如下截图所示:

2.简单数据清洗

首先,删除线路id编号,因为我们本次处理的是一条线路。根据运营状态、在线状态、gps是否有效,可删除无效数据。


利用上下行的标志位,将简单清理后的数据分成两部分,上行部分和下行部分:


 然后,根据不同的公交汽车,把上下行数据按照不通公交车分类。生成两个List。每个List分别对应上行或者下行公共汽车的集合,List的元素就是该公共汽车在数

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

钱塘小甲子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值