目录
1 描述性统计
1.1 描述集中趋势
变异系数是无单位指标(无量纲量)
移动平均其实就可以用来反应整体趋势
1.2 描述离散趋势
1.3 分布
总体方差和总体标准差
样本方差和样本标准差
1 为什么样本方差的分母是 n-1
Note:说明用分母为n的总体方差公式计算的样本方差会低估数据总体的波 动程度
概率分布:每种分布的场景和意义
2 推断性统计
理论基础是大数定律,大量抽样样本的分布符合正态分布。
2.1 参数估计
抽样分布
均值估计
方差估计
z分布和t分布是讲均值的分布的,卡方或者F分布是说方差的分布的。
怎样用样本参数 推断 总体参数
2.2 假设检验
描述不同的区间多大程度上是可信的
4 相关分析:
4.1 回归分析
回归模型就是因变量和自变量的关系是直线的。
一元就是一个自变量,多元就是多个。一元回归模型是直线,多元就是超平面
Note: 非线性回归就是因变量和自变量关系不是直线,可以是逻辑回归那种曲线也可以是多项式那种曲线。
怎样选择 回归模型? 线性回归,多项式回归,逻辑回归
4.1.1 一元线性回归
a,b参数估计方法即模型的确认方法,其主要包括两种方法:最小二乘法,极大似然法
4.2 时间序列分析
5 其他
计学习方法包括模型的假设空间、模型选择的准则及模型选择的算法,称为统计学习方法的三要素,简称模型(model)、策略(strategy)和算法(algorithm)
5.2 协方差
协方差表示的两个随机变量之间的相关性关系的,还有一个类似的是相关系数。
可以通俗的理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如
何?
你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。
你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负的。
从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。
9 参考资料
[人人都会数据分析]