常用的统计分析检验
连续变量和连续变量的关系分析
相关分析
先通过散点图来进行观察,考察相关系数r。r介于1到-1之间,r>0,正相关,绝对值越大相关程度越强。0.3333到0为弱相关,0.3333到0.6666为中相关,0.6666-1为强相关
之后需要判断p值是否小于0.05,是否显著,原假设是不存在线性相关
相关系数r为0意思是两个变量间不存在线性关系,但不代表不存在其它关系。相关关系不等于因果关系
节点:Statistics
功能:检查----选择字段
Stastics-----统计指标
相关-------做相关分析的变量
相关设置-----相关强度的设定选项
A.在输出中表示强度:表示出强度
B.按照重要性(1-p):越接近1代表越有相关关系
0到0.9为弱
0.9-0.95为中
0.95-1为强
C.按绝对值定义-----越接近1越强
卡方检验
分类变量与分类变量之间查看相关关系
先通过”分布“节点绘制堆积条形图来进行可视化观察,然后对认为显著的变量进行卡方检验(列联表分析)
拟合优度:考察理论频数与现实频数之间的差别,没有差别卡方值就是0
p值查看与0.05的关系,原假设是相互独立的
矩阵节点
设置--字段:选定就是手动指定,所有标志(true)是所有标志字段纳入,所有数值是所有数值字段纳入。包含缺失值,对缺失值也进行计算(另立一个类别,与同组其他变量同级)。单元格的函数处的交叠字段就是划分类别的地方,分组的地方
外观-----行和列:排序 交叠字段---会使用特殊颜色对前后几个字段进行标记
t检验及方差分析
连续性变量和分类型变量的配对,独立样本,两独立样本等等以及方差分析(大于2种的变量)
平均值节点
设置---在字段对之间:就是进行配对组 在字段的组之间:独立组比较
选项---设定边际值