研究生阶段基本都在研究这个数据集了,其实也是很无奈的事,没有导师指导也没有师兄弟和实验室,这个数据集用的人多,网上资源也不少,所以就以它为准了,下面是一些基本结论,我先写出来,抽空会把验证过程重新展示出来,主要是防止大家在一些基本问题上多耗费时间吧。
- 这个数据集很干净,任意同工况的10分类难度都不大。简单的卷积模型都能轻易达到99%以上的准确率,因此同一工况下比较方法的优劣其实说服力不大。
- 不同工况之间迁移学习求准确率均值的方法比较常见,可以作为优劣的评判指标。最常见的基本就是3个工况之间互相迁移测试,然后求均值的做法。前几年的论文基本在93%到95%左右,我自己试了很多新的模型和方法,准确率直接飙到99.2%了,这下好像也没啥继续研究地价值了。。。。
- 不同的数据集处理方式对结果影响很大。要不要做滑窗取值、数据集0-1标准化、如果滑窗取值的话是测试集保持分割还是也滑窗?一维时域、二维时域、一维频域、二维频域、短时傅里叶变换时频图、小波时频图,这几个到底差别有多大?这里需要很多次验证,滑窗和标准化肯定是要做的,最好是训练集测试集都做;目前我做的二维频域效果最好,时频图还没有测试过,后续可以试试看。
- 不同方法抗噪能力还是有很大区别的。这个也算是个硬指标,毕竟噪声加再多都可以,直到分出高下。
以上这些只是粗浅的结论,相关证明过程我会花一些时间贴出来,供大家参考讨论,如果有希望我试一试的,也可以留言,一个星期以后论文交了就有时间了~