问题:
当目的是时间序列预测,时间序列,尤其是不平稳的时间序列(存在多个机制),应该怎样进行异常值处理?
参考网址:
https://stats.stackexchange.com/questions/1142/simple-algorithm-for-online-outlier-detection-of-a-generic-time-seriesstackexchange 网址提出了多种解决时间序列异常值识别思路
https://medium.com/wwblog/clean-up-your-time-series-data-with-a-hampel-filter-58b0bb3ebb04Hampel filter方法在R中的应用
结论:
- 异常值识别技术的使用取决于数据本身的性质和你提前对数据做的假设。
- 时间序列的异常值识别技术(即使是高维时间序列),不同于面板数据(高维变量)。它的特点在于不平稳,可能存在多个机制。
- 所以时间序列异常值识别的关键在于去除不平稳性。
- 异常值识别技术可以分为:单变量属性方法、高维变量、特定于模型的技术。
- 去除不平稳性有