关于数据集的补充说明
在REDD数据集中,对每一个房间都有两个总表数据。这两个总表的数据并不一致。在实际使用的时候,REDD数据集默认把总表数据相加。也就是说,两个“分总表”求和,最终得到的功率才是真正的“总耗电量”。此外,总表数据有缺失的数据,在处理的时候,有一种方法是直接采用上一时刻的数据作为缺失的数据。
CO算法和FHMM算法的结果
在NILMTK的说明文档中就有相关算例。链接地址如下:
https://github.com/nilmtk/nilmtk/tree/master/docs/manual
这两个算法用在REDD数据上,总体来看结果一般,如果用前一个月的数据来预测后一个月的数据,FHMM结果比CO结果略好一些。
整体的误差数据看起来很低,但是,不要被结果蒙蔽了。因为,误差低的原因并不是预测得准,而是在预测的时间范围内,仪表大部分时间都没有处于工作状态。这个时间段拉低了预测的误差值,使得整体预测看起来还挺准。