时间序列的异常值处理

4 篇文章 0 订阅

问题描述:开盘价的日收益率出现了异常值,9000多倍,什么原因导致?

答案:如图所示:由于开盘价出现了异常,价格为0.01;导致以此价格为基础计算的相关指标均异常;如果要还原真值,如果用均值与中位数均不合理,个人有两个方案还原,方案一、前后的值取中间值,即前一个开盘价格与后一个开盘价格的均值;方案二、由于开盘价与收盘价相关性非常强,且正相关,补值的价格=当日收盘价格/昨日收盘价*昨日开盘价

 

 结论:替换异常值或缺失值在时间序列数据中,由于特征值取值具有连续性,所以用附近的数据计算补充有更好的效果,比均值和中位数效果要好;补值的根本是要尽可能接近真实值;

 

进一步分析发现:

 

 

查看类似开盘价格与收盘价格的异常,如图用图形显示的话,直接画出走势图,更直接了当,效果更好;

仅管该值是真实情况出现的,但由于样例过少,本人仍然觉得替换掉效果较好,可使用前后值均值计算得出;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值