随手写。
- 统计学statistics,主要两方面;descriptive statistics,描述性统计和statistical inference,统计推断。
- 前者基于数据观察,描述数据;后者基于数据观察,得到数据总体相关的一些结论;后者主要包括两个方面,hypothesis testing,假设检验和estimate,估计。
- 假设检验,通俗讲,就是说我们看到了(抽样、或者仅仅是观察到)这样的数据,这种情况下,总体的参数等于某个值这个假设是否成立、多大置信度上成立、百分之多少的情况下,这个假设会发生。
- 如果这个总体假设下,观察到这个样本值的概率很低,拒绝该假设;这个阈值,就是显著性水平(低的,经常遇见的5%或者1%),significance level;经常用alpha表示;1-alpha即是置信度,confidence level。
- p值就是,这个假设下(总体参数假设和抽样分布假设下),观察到这个值及以上或者以下的概率(具体看假设;是一个区间的概率,而非一个点);如果p值小,表示概率低,认为是小概率事件,认为是抽样误差引起的,拒绝原假设。
- p值是通过观察概率值,比较一些区间出现的概率值和alpha来做假设检验;与之相对应的是,通过比较statistic值的大小来做假设检验,比较计算到的statist