时间序列
文章平均质量分 84
懒惰的coder
这个作者很懒,什么都没留下…
展开
-
幂律分布(python)
首先要说的是中心极限定理——在复杂的多因素情况下,只要个体相互独立,集体效果就应该是正态分布。然而实际运用中,尤其是金融中,更多面对的是尖峰胖尾现象,比如下面这幅图描述的是标普500指数的收益率分布,很明显的是,实际的收益率的分布和理想中的正态分布不一致,这就是所谓的尖峰胖尾特征,峰值更高,尾巴部分也拖的更长更厚。正是有了尖峰胖尾,可以想象,有些东西可以超出想象的大,并且出现这个的概率也非常大,这样的陡峭且延长很长的分布就是所谓的幂律分布(两个特征:陡峭,延长很长)。幂律分布就是概率密度函数服从幂函数的分原创 2022-07-02 23:18:07 · 2190 阅读 · 2 评论 -
时间序列分析-针对时间序列的特殊方法
时间序列分析-针对时间序列的特殊方法本文依据知乎大佬的文章平稳性 许多时间序列的统计学模型都是依赖于时间序列是平稳性的这一前提条件,通常来说,一个平稳的时间序列指的是这个时间序列在一段时间内具有稳定的统计值,如均值,方差。由于我们对于一个数据是否平稳是有自己的直觉的,所以在实践的过程中要谨防过于依赖直觉而被直觉所欺骗。为此我们引入了一些统计上的假设检验来测试一个时间序列数据的平稳性。 其中Augmented Dickey Fuller Test (ADF Test) 是最常使用的一种方法,转载 2022-02-28 23:39:42 · 1591 阅读 · 0 评论 -
时间序列分析—缺失值处理
时间序列分析—缺失值处理本文依据知乎大佬的文章清洗数据数据清洗是数据分析的一个重要环节,对于时间序列数据也不例外,本节将详细介绍针对时间序列数据的数据清洗方法。缺失值处理改变时间频率平滑数据处理季节性问题防止无意识的向前看缺失值处理缺失值的出现很常见,例如在医疗场景中,一个时间序列数据出现缺失可能有以下原因:病人没有遵从医嘱病人的健康状态很好,因此没必要在每个时刻都记录病人被忘记了医疗设备出现随机性的技术故障数据录入问题最常用的处理缺失值的方法包括填补(imputat转载 2022-01-21 12:13:27 · 10880 阅读 · 2 评论