数据集
文章平均质量分 56
UQI-LIUWJ
这个作者很懒,什么都没留下…
展开
-
数据集笔记:北京市摩拜数据(摩拜杯算法挑战赛)
。原创 2024-10-23 08:16:54 · 251 阅读 · 0 评论 -
数据集笔记: FourSquare - NYC and Tokyo Check-ins
【代码】数据集笔记: FourSquare - NYC and Tokyo Check-ins。原创 2024-08-24 20:21:20 · 614 阅读 · 0 评论 -
论文辅助笔记/数据记笔记:SynMob
对于行程轨迹,每个样本表示为一系列连续采样的GPS点,分别记录经度和纬度。原创 2024-07-28 15:45:13 · 379 阅读 · 0 评论 -
数据集笔记:DGraph 大规模动态图数据集
DGraph 是一个有向无权的动态图,包含超过 370 万个节点以及 430 万条动态边DGraph 中的节点表示金融借贷用户,有向边表示紧急联系人关系,每个节点包含脱敏后的属性特征,以及表示是否为金融诈骗用户的标签异常与正常用户比例约为 1:100。原创 2024-06-08 20:21:18 · 433 阅读 · 1 评论 -
数据集笔记:将POI数量映射到geolife location数据上
的location数据的北京POI数据。原创 2024-04-29 07:33:17 · 603 阅读 · 0 评论 -
数据集笔记:geolife staypoint聚合的location 最近的10个其他location
这边的stations,找到每个station 最近的其他10个station。原创 2024-04-28 00:07:22 · 270 阅读 · 0 评论 -
数据集笔记:处理北大POI 数据:保留北京POI
还剩887416条记录。一共1233502行。原创 2024-04-27 23:49:55 · 628 阅读 · 0 评论 -
数据集:trackintel处理geolife数据
论文笔记:Context-aware multi-head self-attentional neural network model fornext location prediction-CSDN博客 对应命令行里这一句根据geolife数据,使用滑动窗口的方法获取staypoint 同时geolife DataFrame加一列staypoint 如果staypoint停留时间>25min,那么是为一个活跃的staypoint在两个stypoint之间的部分创建行原创 2024-04-20 00:32:40 · 969 阅读 · 0 评论 -
数据集笔记:windows系统下载北大开放数据研究平台的POI数据
这是北大开放数据研究平台的POI数据,一开始我以为直接点下载键就可以了,但每次快下完了就又重新开始了,一开始以为是vpn/浏览器的问题,但都不是。gbrecs=true是“复制下载链接”D:\Data\2018-POICSV-1.rar 就是要下载的位置。原创 2024-04-26 11:56:21 · 668 阅读 · 0 评论 -
geolife笔记/python笔记:trackintel.io.read_geolife
键是拥有“labels.txt”文件的用户的用户 ID。包含 geolife 数据的目录路径。包含可用模式标签的字典。原创 2024-04-18 21:01:56 · 435 阅读 · 0 评论 -
数据集笔记:METR-la 原始数据转input/ground truth
在交通预测/时间序列预测的论文中(如模型输入的是过去12个时间片的内容,预测未来12个时间片的内容,而metrla数据集的格式是N*T,那怎么将原始数据集变成N*T*12的格式(test/train数据集)呢?原创 2024-03-19 16:00:26 · 1847 阅读 · 0 评论 -
数据记笔记:USGS 查看上世纪卫星图
1 先到USGS EarthExplorer 界面,在address 处选择需要的城市/也可以在底下polygon处手动标出需要研究的区域。3 点击下方的dataset,然后进入数据集选择界面,勾选‘declassified data’界面,然后点击result。2,点击show,就会出找到的对应的区域,点击这个区域,polygon处就会有响应了。然后选择date range。原创 2024-02-17 23:50:01 · 826 阅读 · 0 评论 -
数据集笔记:UJIIndoorLoc
UJIIndoorLoc是一个多建筑多楼层的室内定位数据库,用于测试依赖于WLAN/WiFi指纹的室内定位系统。原创 2024-01-21 23:25:09 · 1407 阅读 · 0 评论 -
数据集笔记:爱尔兰 LTE Dataset
RSRQ、RSRP和RSSI用于测量小区强度/覆盖范围,因此用于小区选择(切换)(分贝毫瓦)信号强度(信号质量)是在所有资源元素(RE)上测量的,包括来自所有源的干扰(分贝)RSSI表示接收到的功率(宽带),包括服务小区以及来自其他来源的干扰和噪声。RSRP用于测量小区信号强度/覆盖范围,因此用于小区选择(dbMW)RSRQ表示RSRP和接收信号强度指示器(RSSI)之间的比率。RSRP表示在不同RE内携带的特定小区参考符号上的平均功率。小区经度和小区纬度:服务eNodeB的GPS坐标。原创 2024-01-04 11:49:31 · 1106 阅读 · 0 评论 -
geolife 笔记:将所有轨迹放入一个DataFrame
所有对应的操作都在单条轨迹处理中已经说明。原创 2023-12-09 15:11:46 · 775 阅读 · 1 评论 -
geolife笔记:整理处理单条轨迹
m。原创 2023-12-08 16:16:29 · 1154 阅读 · 0 评论 -
数据集笔记 :PEMS-BAY
【代码】数据集笔记 :PEMS-BAY。原创 2023-11-29 20:45:24 · 4244 阅读 · 10 评论 -
数据集笔记:Pems 自行下载数据+python处理
以下载District 4的各station每5分钟的车速为例。原创 2023-11-21 19:48:46 · 4292 阅读 · 15 评论 -
数据集笔记:Telecom Shanghai Dataset
电信数据集展示了6个参数,例如月份、数据、开始时间、结束时间、基站位置、手机ID。通过数据集可以找到用户的轨迹。每15天一个表。原创 2023-11-09 16:28:07 · 1322 阅读 · 0 评论 -
数据集笔记:分析OpenCellID 不同radio/ create_time update_time可视化
(以新加坡的cellID为例)原创 2023-10-12 21:00:19 · 558 阅读 · 0 评论 -
数据集笔记:杭州地铁刷卡数据
杭州20190101至20190125共25天地铁刷卡数据记录,共涉及3条线路81个地铁站约7000万条数据同时包含了路网地图,即各地铁站之间的连接关系表。原创 2023-09-30 19:50:13 · 1097 阅读 · 0 评论 -
数据集笔记:OpenCelliD(手机基站开放数据库)
数据集笔记:OpenCelliD(手机基站开放数据库)原创 2023-09-30 19:41:16 · 3378 阅读 · 5 评论 -
数据集笔记:旧金山共享单车OD数据
数据地址:System Data | Bay Wheels | Lyft原创 2023-09-30 14:45:30 · 201 阅读 · 0 评论 -
数据集笔记:芝加哥共享单车OD数据
2013年到2022年3月,芝加哥共享单车OD数据。原创 2023-09-30 11:28:03 · 305 阅读 · 0 评论 -
数据集笔记:华盛顿共享单车OD数据
2010~2022 共享单车OD数据。原创 2023-09-30 11:19:46 · 235 阅读 · 0 评论 -
数据集笔记:纽约花旗共享单车od数据
花旗共享单车公布的其共享单车轨迹数据,包括2013年-2021年曼哈顿、布鲁克林、皇后区和泽西城大约14500辆自行车和950个站点的共享单车轨迹数据。原创 2023-09-29 15:05:05 · 617 阅读 · 2 评论 -
数据集笔记:上海摩拜共享单车
017年8月上海地区摩拜单车的数据,已脱敏处理。原创 2023-09-29 13:51:22 · 508 阅读 · 0 评论 -
数据集笔记:2015上海地铁一卡通数据
上海2015年几天的地铁一卡通出入站信息卡号、交易日期、交易时间、公交线路/地铁站点中文名称、行业名称(公交、地铁、出租、轮渡、P+R停车场)、交易金额、交易性质(非优惠、优惠、无)。金额为0的表示进站,金额不为0的表示出站比如这个用户,16:25从南京东路进站,坐2号线到广兰路(16:54下车)原创 2023-09-29 11:31:03 · 535 阅读 · 3 评论 -
数据集笔记: Porto
波尔图数据原创 2023-09-28 17:28:12 · 1224 阅读 · 0 评论 -
数据集笔记:T-drive 北京出租车轨迹数据
taxi id 时间 经度 纬度。原创 2023-09-22 14:53:33 · 963 阅读 · 0 评论 -
数据集笔记:杭州 & 上海 地铁客流数据
从5:15到23:30的地铁乘客流量预测使用前四个时间间隔(15分钟 x 4 = 60分钟)的地铁乘客流量(进/出流量)来预测未来四个时间间隔(15分钟 x 4 = 60分钟)的地铁乘客流量(进/出流量)5:15-6:15 -- 预测 -> 6:15-7:155:30-6:30 -- 预测 -> 6:30-7:30...21:15-22:15 -- 预测 -> 22:15-23:1521:30-22:30 -- 预测 -> 22:30-23:30每天可以分为66个时间片段。原创 2023-09-21 10:29:39 · 2463 阅读 · 10 评论 -
数据集笔记:Beijing-BRT-dataset
这个数据集包含1,280张图片,标注了16,795名行人,用于人群分析。使用720张图片进行训练,560张图片进行测试。名为"frame"的文件夹包含人群图像。名为"ground_truth"的文件夹包含真实标签。例如,'1-20170325134657.jpg' 对应于 '1-20170325134657.mat'此图像中第i个人的真实位置由每行的位置[x,y]给出。原创 2023-09-19 17:35:32 · 505 阅读 · 0 评论 -
数据集笔记 geolife (操作篇)
可以看到,其实它相当于三段子轨迹拼成的。就像前面对空间和时间距离的describe一样,大部分都是比较小的时空距离,但max值会大很多。此时0~147 是比较连贯的轨迹(后面就不贴代码了,把上述代码pos[147:151]的这两个数字替换掉就可以)这里我们有特别好的方法,就是每一个这种区间我都可视化以下,找到这两个“断点”应该在哪里。此时已经找到了两个“断点”了,我们看一下其他时间间隔大的是什么情况。原创 2023-09-07 11:44:29 · 1690 阅读 · 0 评论 -
数据集笔记:GeoLife GPS 数据 (user guide)
182名用户在超过三年的时间内(从2007年4月到2012年8月)在(微软亚洲研究院)Geolife项目中收集的。该数据集的GPS轨迹由一系列带有时间戳的点组成,每个点都包含纬度、经度和海拔的信息数据集包含17,621条轨迹,总距离大约为120万公里,总持续时间为50,176小时这些轨迹是由不同的GPS记录仪和GPS手机记录的,并且具有各种不同的采样率91%的轨迹是以密集的表示方式记录的,例如每15秒或每510米记录一个点。原创 2023-09-06 20:34:17 · 3979 阅读 · 3 评论 -
数据集整理: 新加坡POI数据 LTSG
LTSG数据集包含新加坡的兴趣点(POIs)、组屋(HDB)和公共交通数据。POI数据包含人们有兴趣因特定目的而访问的地点包括但不限于:教育机构,如学校或图书馆购物场所,如超市或便利店娱乐场所,如公园或酒吧一般来说,POI数据可以告诉我们在这些地点发生了什么样的活动。HDB数据包含人们居住的公寓楼的数据点。简而言之,HDB数据显示人们居住的地方,而POI数据显示人们访问的地方。每天,人们在这些地点之间旅行,形成了它们之间的某种联系。原创 2023-07-22 13:29:53 · 616 阅读 · 0 评论 -
论文笔记:A multi-source dataset of urban life in the city of Milan and the Province of Trentino
描述了两个地理区域上发布的丰富的多源数据集。该数据集由米兰市和特伦蒂诺省的电信、天气、新闻、社交网络和电力数据组成。每当用户进行电信互动时,运营商会分配一个无线基站(RBS radio base station)并通过网络进行通信。然后,会创建一个新的CDR记录该交互的时间和处理该交互的RBS。通过RBS,可以获取用户的地理位置指示,这得益于覆盖地图Cmap,它将每个RBS与其所服务的领土部分(也称为覆盖区域)相关联(下图)一些数据集使用在领土上叠加的规则网格进行空间聚合。原创 2023-06-11 01:26:06 · 1563 阅读 · 2 评论 -
数据集笔记:CDR数据集(用户满意度分类)
CDR数据原创 2023-06-10 15:35:30 · 505 阅读 · 0 评论 -
数据集:T-Drive(北京出租车轨迹数据)
数据集包含了2008年2月2日至2月8日期间在北京市内的10,357辆出租车的GPS轨迹。总共包含约1500万个GPS点,轨迹总里程达到了900万公里。图1显示了两个连续点之间的时间间隔和距离间隔的分布情况。平均采样间隔约为177秒,平均距离为623米。该数据集的每个文件以出租车ID命名,每个文件包含了一辆出租车的轨迹数据。图2可视化了该数据集中GPS点的密度分布情况。原创 2023-05-30 11:28:58 · 5764 阅读 · 22 评论 -
数据集笔记:Uber Movement (Speed)【python 处理数据集至时空矩阵】
以伦敦威斯敏斯特的一个小区域为例。原创 2023-02-08 18:41:44 · 1172 阅读 · 3 评论
分享