统计学基础
描述性统计
数据类型
数据的位置
数据的离散度
随机变量简介
概率与概率分布
离散型随机变量
连续型随机变量
期望值与方差
二项分布
正态分布
其它分布
变量的关系
推断统计
区间估计
假设检验
t检验
单样本t检验
独立样本t检验
配对样本t统计量的构造
方差分析
方差分析之Python实现
单因素方差分析
多因素方差分析
析因素方差分析
回归分析
一元线性回归模型
多元线性回归模型
考量自变量共线性因素的新模型
描述性统计
数据类型
数据可分为两类:
1、定性数据:对事物性质进行描述的数据,通常只具有有限个取值,往往用于描述类别
2、定量数据:呈现事物数量特征的数据,是由不同数字组成的,数字取值是可以比较大小的
数据的位置
样本平均数 mean()
中位数 mdedian()
众数 mode() 返回Series类型数据,第二个数是众数
百分位数 quantile(i) for i in [0.25,0.75] 返回下四分位数和上四分位数
数据的离散度
极差 max()-min()
平均绝对偏差 mad()
方差 var()
标准差 std()
随机变量简介
概率与概率分布
概率(Probability)是用来刻画事物不确定性的一种测度,根据概率的大小,我们可以判断不确定性的高低。概率的取值介于0和1之间,表明一个特定事件以多大的可能性发生。
离散型随机变量
在Python中,通过NumPy包的random模块中的choice()来生成特定的概率质量函数的随机数
choice(a,size=None,replace=True,p=None)
参数a:指明随机变量所有可能的取值
参数size:表示所要生成的随机数数组的大小
参数replace:决定了生成随机数时是否是有放回的
参数p:为了一个与x等长的向量,指定了每种结果出现的可能