出租车数据要求

出租车数据要求

时空大数据的质量评估

评价的基本准则

  1. 数据的基本特征:根据设备采样的基本采样频率

    例如:采样频率15s一条,那么可以分析出行的OD信息、车辆的运行速度、交叉口的延误等

    ​ 1s一条,那么可以用来分析车辆的运行工况、加减速等;

    ​ 1~2h一条,车辆大致的分布、出行的热点分布等

  2. 数据的完整性

    首先观察数据本身的内容是否有缺失值,需要检查是否存在经纬度、时间、运营状态等,如果存在缺失值,数据的缺失率是多少?能否补全?删除缺失数据是否会影响分析结果?

    对于时空大数据,数据完整性还需要考虑个体、时间与空间维度

    个体维度上:数据是抽样数据还是全样本数据?

    如果是抽样数据,数据量是多少?如何抽样?抽样率是多少?抽样数据在时空上有什么特征?数据是城市中一家出租车公司的数据还是全部出租车运营公司的数据总和?

  3. 数据的准确性

    根据某市出租车数据根据经纬度是否在该市的地理范围内?如果超出该市的地理范围,超出距离大概是多少?

时空大数据的时间完整性评估

时空大数据的时间信息可能包括年、月、时、分、秒等时间单位,如果没有设定时间格式,读取进来的时间字段将以字符串形式呈现;

核心工作为:

  • 如何从时间字段中提取出小时信息ÿ
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值