此为反演模型的章节第一部分,统计学基础:概率论、矩阵和数理统计的知识
# 1 基本统计概念
知识在于应用,而非记忆!
我们都是在样本的层面去操作数据的,以达到对总体性质的估计和推断,拿到一组数据首先进行基本的统计描述,常用的有:
样本均值:
样本方差(调整方差)不是除以n,而是n-1,
标准差为样本方差开方即可
皮尔逊积矩相关系数(简称相关系数):
相关系数范围在[-1,1]之间,当为0时表明两变量之间不存在线性关系,称其为不相关,其绝对值越接近1表明线性相关程度越强,在通过显著性判断之后,可以通过其数值大小进行比较。另外还有其他相关系数指标,如斯皮尔曼相关系数等。
变异系数C.V. :标准差/均值
标准化:
Excel演示:
首先加载Excel的数据分析工具:
Excel中的数据分析工具-百度经验jingyan.baidu.com之后在数据工具栏下面就可以看见数据分析工具了,
- 描述统计
点击数据分析-统计描述,输入变量区域,如果第一行是变量名,则勾选标志位于第一行,勾选汇总统计,设置置信度,一般为99%,95%,选择输出位置;
点击确定,出现如下结果,有常见的描述统计量,需要说明的是Excel是以T分布计算置信度的,(一般样本量少于30时用t分布,大于30时用正态分布,但也可以用T分布),标准误差是标准差/
,其置信度计算为
即