目录
1.读取线圈检测器数据样例:Detector_sample.csv, 输出总记录数
4.统计冗余记录数,如有需剔除. (参考函数:duplicated())
5.计算流量、速度、占有率的平均值、方差、25%、50%和75%分位数
7.分别提取日期时间列的小时、分钟、秒,新增为DAY、MINUTE、SECOND列.
一、数据框操作
1.读取线圈检测器数据样例:Detector_sample.csv, 输出总记录数
代码:
data<-read.csv("F:\\data\\Detector_sample_update.csv")
View(data)
输出结果(篇幅所限,仅截图首尾,中间略):
2.统计流量一列的缺失个数.
代码:
table(is.na(data[3]))
输出结果:
即缺失个数为3
3.对包含缺失值的行进行剔除,输出剔除后记录数.
代码:
na_omit_data<-na.omit(data)
print(nrow(na_omit_data))
输出结果:
即剔除后记录数为4323