时间序列–大航海学习–Task1
统计与时间序列分析基础
基础就是概率论。数理统计研究的对象是受随机因素影响的数据(以下简称数理统计或统计),统计是以概率论为基础的一门应用学科。
概率论复习
- 总体是人们研究对象的全体,如学校全体学生的身高。
- 总体中的每一个基本单位称为个体。
- 个体的特征用一个变量 (如 x ) 来表示。一个身高 170(cm) 的学生记 x = 170 。
- 从总体中随机产生的若干个个体的集合称为样本。
- 从总体中随机取得的一批数据,记作 x1, x2, · · · , xn, 其中 n 称为样本容量。
- 统计的任务是由样本推断总体。
- 将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数。
- 统计量:
1.表示位置的:算术平均值,中位数。
2.表示变异程度的:标准差(从无偏估计的角度出发除以的是n-1)、方差、极差(无偏估计:认为所有样本出现的概率都一样)
3.表示分布形状: 偏度和峰度 - 统计中常用概率分布
- 随机变量的特性完全由它的分布函数或密度函数来描述。密度函数—积分—分布函数
- 上 α 分位数是下面常用的一个概念,其定义为: 对于 0 < α < 1,使某分布函数 F(x) = 1 − α 的 x,称为这个分布的上 α 分位数,记作 xα
- 正态分布,偏度为0,峰值为3,自然界中一种生物的数量特征等,多 数情况下都服从正态分布
- 卡方分布
- t 分布
- F 分布
参数估计(总体的分布函数形式已知,某些参数未知,借助样本估计):点估计和区间估计(有置信区间和置信概率)
假设检验(在总体的分布函数完全未知或只知其 形式但不知其参数的情况):根据样本对所提出的假设做出判断: 是接受还是拒绝。
方法:单个总体N(µ, σ2) 均值 µ 的检验和分布拟合检验
R语言基础学习
- 向量
> x <- c(1,2,3,4,5)
> y <- c(1,2,3,4,5)
> z <- x+y
> w <- x*y
- 矩阵
> mat1 <- matrix(1:12,nrow=3)
> View(mat1)
> View(mat1)
> mat2 <- matrix(1:12,ncol=3)
> View(mat2)
- 生成时间序列
> ts(1:26,start=1988) Time Series: Start = 1988 End = 2013 Frequency = 1 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 [26] 26
- 图像绘制
> x <- rnorm(100)
> x
[1] -0.71587665 -1.24812912 -0.02205554 -1.08546376 -1.37267361 1.42091842
[7] 0.02164899 -0.53942969 0.70875797 0.85266833 -0.49220063 0.33744409
[13] -1.08694811 0.93980286 -0.03639552 0.37466835 -0.26841435 0.11369332
[19] -0.32034713 -1.04753803 0.19019099 0.76662167 0.61831868 -1.00300323
[25] -1.58002524 0.11452900 -1.19562274 0.95235796 -0.41784460 2.66984159
[31] 0.15083679 -1.71240033 -0.51875708 -0.24599055 -0.67564504 0.32044840
[37] -0.00371090 -1.14320206 0.22577255 -1.24020920 -0.91485588 0.03204302
[43] -0.96811846 -0.68735302 1.43922345 -0.34257735 0.44481955 -0.46944785
[49] 0.17677600 -0.40402512 -0.62759424 -0.63173733 -0.45983048 1.95625554
[55] 0.76960673 0.44433642 -0.53797300 -0.65139930 -0.52253296 -1.40931737
[61] -1.56386210 2.46901236 1.31222833 -0.28221855 -0.64220879 -0.25669357
[67] 0.89571928 -0.42089158 0.03909546 0.31386216 -0.14441567 -0.71481302
[73] -0.12434253 0.94026236 -1.43364440 -0.93515688 0.31304425 0.17500951
[79] -1.78015401 1.03055286 -1.22641672 -1.05056587 -1.54545630 1.80418656
[85] 1.73719089 -0.21020326 0.42822367 0.13689763 2.34407192 -1.58813515
[91] -0.90929230 0.90689012 -1.56685760 0.58843337 -1.03944653 1.10524844
[97] -0.62770638 0.80752080 1.25082122 0.02940490
> plot(x)
> plot(ts(x))
> op <- par(mfrow=c(2,1),mar=c(5,4,2,2)+ .1)
> plot(ts(x))
> acf(x,main="")
`![同时插图2张](https://img-blog.csdnimg.cn/ccccfa5e834c4c9aa73c738fe6e53d73.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAcXFfNDU3ODk3MzE=,size_16,color_FFFFFF,t_70,g_se,x_16#pic_center)
``