目录
拟合优度检验
功能:用于拟合度分布
首先确定分布模型,通过参数估计方法(矩估计,极大似然估计)确定分布模型参数
,就可以知道分布函数
,然后判断观测数据是否来源于分布
以下对算法的基本思想及其计算步骤进行简单介绍,具体过程用python或者matlab自带的包求解
Q-Q图
基本思想:若拟合效果好,经验分布函数的分位数应当与分布模型的理论分位数近似相等
计算步骤:
1、将观测数据按照从小到大顺序排列成
2、取
3、将画在直角坐标图上
4、如果这个点看起来呈现一条45°的直线,从
到
分布,则证明拟合效果很好,数据来源于分布
K-S检验
基本思想:若拟合效果好,经验分布函数和拟合分布函数之间距离越小
计算步骤:
1、将观测数据按照从小到大顺序排列成
2、进行假设检验,零假设为所指定的分布是否可接受,对立假设为拒绝
3、定义检验统计量为
此时,显著性水平对应的临界值为
,
显著性水平对应的临界值为
,
显著性水平对应的临界值为
,其中
为样本个数
4、若计算出来的统计量小于临界值,说明不能拒绝零假设,所假设的分布可以接受;反之,拒绝原假设,所假设的分布不能接受
卡方检验
适用于分组数据分布拟合问题假设
基本思想:若拟合效果好,数轴上子区间范围内实际样本数和拟合函数对应的样本数差距小
图论相关
基本概念
简单图(不含环和多重连接边的图),完全图
子图,支撑子图或生成子图(包含图中所有节点的子图),连通图
最小生成树(最小支撑树)
概念:一棵生成树上所有树枝权的总和被称为生成树的权,具有最小权的生成树被称为最小生成树
下面简单介绍最小树的两种算法
Prim算法
P存放最小生成树中的节点,Q存放最小生成树的边
1、
2、当
找最小边,其中
若,算法终止
Kruskal算法(避圈法)
1、选取图中权值最小的边
2、在未选中的边中选取不成环的边,直到选到条边
破圈法
1、在图中找一个回路
2、去掉该回路中权值最大的边,但要保持图仍为连通
3、反复此过程,直至图中再无回路(但仍保持连通),得到最小生成树