图形:条形图、线性图、饼图、茎叶图、箱线图
统计学是什么:
1、描述性统计学
2、推论统计学
集中趋势:“平均数”-最能代表一组数据的数值
均值、算数平均数、中位数、众数
样本和总体:
总体-美国所有男性的身高(每一刻都有人去世或者死亡,无法统计到准确的数值) 总体均值:
样本-从总体中随机选取部分 样本均值:
均值用来衡量集中趋势,但有些值会偏离的远一些,方差用来衡量个体距离均值的分散程度,方差=一组数据平均离均值的远近程度=
样本方差是用来估计总体方差的
样本方差,提高无偏估计,无偏样本方差:
标准差:
上面俩公式开根号就是各自的标准差了,这样算出来的样本标准差不是总体标准差的无偏估计
方差用下面的公式算会很快
随机变量:
通常用大写字母表示,其实是一种函数,将随机过程映射到实际数字,进行量化
随机试验,抛硬币,正面以1表示,反面以0表示,使用随机变量X(函数映射)
离散随机变量(可以枚举,比如抛硬币的结果),连续随机变量(比如明天下雨的尺寸数)
概率分布:
X=色子向上显示的数 正常色子
均匀分布
X=色子向上显示的数,没有2,有俩6的色子
P(X=1)=1/6
P(X>4)=1/6+1/3=1/2
概率密度函数:
Y=明天的雨量
如果要求明天刚好雨量等于2厘米,那么,概率只能是0,因为2.000000000000000001,1.9999999999999999999都不能算进去,概率密度函数只能求区间概率,P(|Y-2|<=0.1)=就是阴影面积