在准备阶段,我们取得了突破性的进展,全面掌握了这个题目的来源和做法,下面开始做第一问。
解题思路
明确技术路线
开始做题目之前,在前面的基础工作开展后,就可以明确汽车行驶工况构建的基本研究技术路线了:
在前面两个研究内容上,题目已经给出了最终的成功,也就是数据给我们了。但是首先得弄明白:数据怎么得来的?数据采集自哪个地区?驾驶员是哪一类人?车辆是什么类型的?
这些从所给文件,以及题目介绍的内容,加上文献的中一些信息,整合就可以得到。即:
研究人员采集的是福建省福州市和莆田市,采集的对象是轻型汽车,涉及的应该是三个不同的驾驶员驾驶的不同汽车。
明确数据内容
题目给了三个文件,每个文件采自自同一辆车,采集时间基本上都是连续的一个星期。每个文件的数据也大致一样多。
文件 | 数据量 | 采集起始时间 | 采集终止时间 | 采集区域 |
---|---|---|---|---|
文件1 | 185725 | 2017/12/18 13:42:13 | 2017/12/24 13:37:49 | 福建省福州市 |
文件2 | 145825 | 2017/11/01 19:11:50 | 2017/11/07 19:09:48 | 福建省莆田市 |
文件3 | 164914 | 2017/12/01 19:43:57 | 2017/12/06 19:40:20 | 福建省福州市 |
可以看到,在起止时间范围内,按照每秒采集一组数据(采集频率为1Hz),那么必然数据量不止这么点!中间缺失了大量的因为时间不连续而丢失掉的数据!
此外,数据文件中的所有字段的运动学意义必须弄明白:
- 时间 这个好理解,就是每一秒记录一组数据,这个在时间维度上帮助我们分析数据是否存在异常丢失,是个很关键的字段。
- GPS车速 这个字段应该由GPS设备采集到经纬度地理位置后,根据采样时间间隔计算出来的,所以当车速异常时,极大可能就是GPS设备异常了,需要认真观察。
- XYZ三轴加速度 这个字段真的不太好确定具体含义,我的理解是,可能是车上的某个部位贴的一个传感器,XY方向为贴片贴合面两个方向,Z方向为垂直于贴片的方向。当汽车发生上下颠簸时,X方向会有加速度;当汽车发生急速转弯时,因为惯性会有侧边的Y方向加速度,而汽车前进的方向则是Z方向的加速度。不知道理解的对不对,但是其实这个参数意义不大,车的加速度可以直接由GPS车速除以时间间隔就行了。
- 发动机转速 一般来说,发动机转速增加意味着加速;当汽车发动机转速低于一定值时,可能就是怠速运行了。即此时汽车发动机在运转,但对外不输出功率;发动机转速长期为0,那就是汽车熄火了。
- 扭矩百分比 这个发动机转速和扭矩百分比是研究发动机的重要指标,但从数据上来看,基本上变化不大。
- 瞬时油耗 汽车在启动的瞬间,油耗会非常高,或者怠速和刹车时,也会比较高。
- 油门踏板开度 简单的理解就是,你踩油门的深度,油门越大,喷油越多,汽车加速。也就是我们所说的踩油门。
- 空燃比 这个是空气和燃料的混合百分比,具体怎么用,不是特别清楚。
- 发动机负荷百分比 发动机在某一转速下,当时发动机发出的功率与同一转速下所可能发出的最大功率之比,以百分数表示。。
- 进气量 进气量指汽车发动机进入外界清新空气的流量 。是发动机在工作时氧气的进入,才能保证正常运行。暂态工况下缸进气量的准确估计是提高发动机空燃比控制精度的有效措施之一
此外,一般汽车运行时,一般都会经历这么几种工作运行状况(简成工况),可以看作一个完整的周期运动:
这期间还有一些更复杂的工况,需要查阅资料来熟悉。当然,如果你考过驾照,那做这个题目可能就会比较好理解这里的字段了。
数据预处理解题过程
问题分析
在题目中,题目给出了数据预处理中存在的几个需要处理的数据异常判断标准。在这里我们还是要再重新整理下,转变成可以建模的依据:
时间不连续问题
首先,因为GPS的问题,造成数据采集时间不连续,而题目的数据全部是连在一起的,所以第一步就需要把数据离散到对应的时间节点上,我称之为 ”时间对齐“ 处理。
GPS丢失问题
造成GPS丢失问题的原因一般就两个。
- 一个是由于设备自身故障,比如电路异常等,造成的设备短时异常,使得设备会在短暂的1s内,采集不到数据,造成时间不连续,这种情况持续时间很短;对于这样的数据,可以通过插值补齐(说白了就是前后数据的求均值)。
- 另外一个是由于外部原因,比如高层建筑物遮挡、屏蔽,过隧道等等,设备信号直接被屏蔽了,也就采集不到,造成时间不连续,这种情况持续时间比较长。可以直接剔除掉不考虑。
经纬度异常问题
根据还原经纬度发现,经纬度有存在全为0的情况,这样的数据要直接剔除掉。
长期停车(熄火/不熄火)问题
因为设备采集系统是安装在汽车上的,驾驶员是否熄火停车,将会直接影响到设备是否能供电的问题。若停车不熄火&#x