1.计算第p百分位数
2.标准差系数
以百分数形式反映变异程度
3.z-分数
4.切比雪夫定理
适用于任何数据集,不论数据分布的形态
5.经验法则
当数据集呈正态分布时使用
6.异常值
对于钟形分布数据,根据经验法则,利用z-分数检查异常值时,而已吧z-分数小于-3或者大于+3的数值视为异常值。
7.箱形图
8.两变量间关系度量
(1)协方差
协方差表示两者相关关系:正的协方差表示变量间正相关关系,负的协方差表示变量间负相关关系。为了度量相关的程度,用相关系数。
(2)相关系数
相关系数取值范围为[-1,1],越接近1越呈现强线性正相关,越接近-1越呈现强线性负相关(线性关系不意味着因果关系)
9.加权平均数
10.分组数据
11.公式总结1
12.计数法则
13.贝叶斯定理
14.离散型概率分布
令f(x)为x的概率函数,表示x每一个取值的概率
15.二项分布
如果具有性质(2)(3)(4),即二项试验的一次试验成为贝努利试验。
16.泊松分布
17.超几何分布
当n足够大时,超几何分布近似为成功率为p=r/N的二项分布
18.连续型随机变量
与离散型最大的不同时,连续型没有随机变量x取某个特定值的概率f(x),有概率密度函数,也记为f(x)。但是概率密度函数并没有直接给出概率,f(x)曲线下的面积为连续型随机变量在该区间内取值的概率。因此连续型随机变量只能给出某个区间内的概率,某点的概率为0(某点时f(x)曲线下面积为0)。
19.均匀分布