数据集笔记 :PEMS-BAY

数据地址:DCRNN - Google 云端硬盘

各station 位置:DCRNN/data/sensor_graph/graph_sensor_locations_bay.csv at master · liyaguang/DCRNN (github.com)

1 读取 数据 

import h5py
file='Downloads/pems-bay.h5'

f=h5py.File(file,'r')
f.keys()

f['speed']
#<HDF5 group "/speed" (4 members)>
#说明speed是一个group,不是dataset

f['speed'].keys()
#<KeysViewHDF5 ['axis0', 'axis1', 'block0_items', 'block0_values']>
f['speed']['axis0'][:].shape,f['speed']['axis0'][:]
'''
((325,),
 array([400001, 400017, 400030, 400040, 400045, 400052, 400057, 400059,
        400065, 400069, 400073, 400084, 400085, 400088, 400096, 400097,
        400100, 400104, 400109, 400122, 400147, 400148, 400149, 400158,
'''

f['speed']['block0_items'][:].shape,f['speed']['axis0'][:]
'''
((325,),
 array([400001, 400017, 400030, 400040, 400045, 400052, 400057, 400059,
        400065, 400069, 400073, 400084, 400085, 400088, 400096, 400097,
        400100, 400104, 400109, 400122, 400147, 400148, 400149, 400158,
'''

#这两个是一样的,都是station的id
f['speed']['axis1'][:].shape,f['speed']['axis1'][:]
'''
((52116,),
 array([1483228800000000000, 1483229100000000000, 1483229400000000000, ...,
        1498866300000000000, 1498866600000000000, 1498866900000000000],
       dtype=int64))
'''

#时间


import pandas as pd

datetimes=pd.to_datetime(f['speed']['axis1'][:])
datetimes
'''
DatetimeIndex(['2017-01-01 00:00:00', '2017-01-01 00:05:00',
               '2017-01-01 00:10:00', '2017-01-01 00:15:00',
               '2017-01-01 00:20:00', '2017-01-01 00:25:00',
               '2017-01-01 00:30:00', '2017-01-01 00:35:00',
               '2017-01-01 00:40:00', '2017-01-01 00:45:00',
               ...
               '2017-06-30 23:10:00', '2017-06-30 23:15:00',
               '2017-06-30 23:20:00', '2017-06-30 23:25:00',
               '2017-06-30 23:30:00', '2017-06-30 23:35:00',
               '2017-06-30 23:40:00', '2017-06-30 23:45:00',
               '2017-06-30 23:50:00', '2017-06-30 23:55:00'],
              dtype='datetime64[ns]', length=52116, freq=None)
'''
f['speed']['block0_values'][:].shape,f['speed']['block0_values'][:]
'''
((52116, 325),
 array([[71.4, 67.8, 70.5, ..., 68.8, 71.1, 68. ],
        [71.6, 67.5, 70.6, ..., 68.4, 70.8, 67.4],
        [71.6, 67.6, 70.2, ..., 68.4, 70.5, 67.9],
        ...,
        [71.4, 66.9, 68.1, ..., 68.4, 71.6, 66.6],
        [72.2, 66.5, 68. , ..., 68.7, 71.6, 68.4],
        [71.5, 66.2, 68.4, ..., 68.7, 71.6, 68. ]]))
'''

每个时刻的速度了

2 station位置可视化

2.1 读取数据

import pandas as pd
df=pd.read_csv('Downloads/graph_sensor_locations_bay.csv',names=['station_id','lat','lon'])
df

2.2 找到经纬度的平均点

mean_lat=df['lat'].mean()
mean_lon=df['lon'].mean()
mean_lat,mean_lon

2.3 画图,每个station一个marker,同时点开这个station会弹出对应的station id,和经纬度

import folium


m=folium.Map(location=(mean_lat,mean_lon),zoom_start=12)

for i in df.iterrows():
    #print(i)
    tmp_lat=i[1]['lat']
    tmp_lon=i[1]['lon']
    tmp_id=i[1]['station_id']
    #print(tmp_lat,tmp_lon)
    folium.Marker(location=(tmp_lat,tmp_lon),
                 popup=str(int(tmp_id))+' : '+str(tmp_lat)+' , '+str(tmp_lon)).add_to(m)
m

  • 10
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论
### 回答1: PEMS-BAY数据集是一个交通流量数据集,适用于交通预测和控制场景。该数据集覆盖了旧金山湾区的193个道路段,收集了自2017年至2018年的5分钟间隔交通流量数据。这个数据集是在伯克利加州大学的智能交通系统实验室提供的,以帮助研究者更好地理解交通流量的变化和预测。PEMS-BAY数据集的下载也非常简单,只需访问该实验室的网站,免费注册并下载即可。 下载PEMS-BAY数据集首先需要进入伯克利加州大学的智能交通系统实验室官网,在该网站的页面上找到PEMS-BAY数据集的下载链接。在下载前,需要先注册一个账号,输入注册信息后验证注册邮箱并登录,然后进入设有PEMS-BAY数据集的下载页面。在该下载页面上,可以选择下载该数据集的所有csv文件或者将其拆分成多个zip文件进行下载,选择后即可开始下载。PEMS-BAY数据集的大小为222 MB,根据网络环境和下载速度可能需要不同的时间完成下载。 总的来说,PEMS-BAY数据集的下载相对简单,只需注册账号并在官网页面上进行操作即可获取。这个数据集对于进行交通预测和控制等方面的研究具有重要意义,具有很高的实用价值。 ### 回答2: PEMS-BAY数据集是一种交通流量数据集,包括密集区域的拥堵数据,基于17个主要高速公路和城市道路的流量数据,是美国加利福尼亚州东海岸湾区的实时交通快照。 PEMS-BAY数据集可以用于交通预测、交通控制、交通规划等领域的研究。该数据集主要资源是交通流量的数据,通过这些数据可以了解道路状况、交通拥堵情况、车辆速度等交通信息。数据集从2008年1月到2009年1月,多数数据的时间分辨率为5分钟。 为了下载PEMS-BAY数据集,用户可以从美国加利福尼亚大学伯克利分校的交通研究中心(Traffic Research Center)获取。用户需要提供自己的姓名、邮箱、工作单位等相关信息,并且需要签署一个使用协议。一旦获得使用权限,用户可以获得该数据集的下载链接,下载数据并在自己的研究中使用。 总之,PEMS-BAY数据集是一种极具实用价值的数据集,可以为交通领域的相关研究提供有力支持和帮助。用户可以通过请求访问并签署相关协议来下载数据集。 ### 回答3: PEMS-BAY数据集是一个基于贝利地区的人工交通流数据集,是美国加州交通局的交通研究所发布的。这个数据集包括了由传感器采集的交通流信息,主要包括了车辆数量、速度和密度等数据。这个数据集不仅可以被用于交通流预测,还可以用于交通拥堵分析和交通控制方案制定。 如果你想下载PEMS-BAY数据集,可以访问官方网站进行下载。在官网页面上,你可以找到PEMS-BAY数据集的下载链接,以及相关的数据说明文档。数据集的下载文件较大,需要耐心等待下载完成。 下载完成后,你可以使用各种数据处理软件进行数据解析和分析。一般可以使用Python或MATLAB等编程语言进行处理分析。通过对PEMS-BAY数据集的分析,可以为城市交通管理及规划等方面提供重要的参考和依据。 总之,PEMS-BAY数据集是一个非常有用的数据资源,可以广泛应用于交通流分析和研究领域,使交通管理工作更加高效和精准。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UQI-LIUWJ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值