统计学检验

一 统计学方法选择

1 配对样本和独立样本

配对设计

配对设计目的是控制非试验因素对结果的影响,具有两种常见的形式:自身配对和非自身配对(异体配对)。自身配对是同一受试对象的比较,而非自身配对是比较两个配对的受试对象。配对的受试对象具有相同的特征,例如年龄、体重、性别等。

配对t检验 

例1:接受手术A的患者术前与术后肌酐水平的比较?

步骤1:判断是否为配对设计;步骤2:差值是否符合正态分布;步骤3:配对t检验提出假设;步骤4:计算统计量,做出推断。

配对t检验 vs. 两独立样本t检验

配对t检验和两独立样本t检验都属于t检验,理论基础相似、统计数据都要求满足正态性,且都只对定量资料适用。配对t检验的试验设计属于配对设计,而两独立样本t检验属于两组设计

对于正态性要求方面,虽然两者都要求数据满足正态分布,但关注的焦点不同。配对t检验要求差值满足正态分布,从而检验差值的总体均数是否为0;两独立样本t检验要求两个样本的数据满足正态分布,从而检验两组的总体均数是否相等。

总体而言,配对t检验 vs. 两独立样本t检验的最核心区别是适用的试验设计不同。

 Wilcoxon符号秩和检验

当配对资料不满足正态性(转换后仍不正态)选择非参数检验,即Wilcoxon符号秩和检验。

Wilcoxon符号秩和检验,也被称作符号秩和检验、符号秩检验;常听到的秩和检验狭义上代指两独立样本的秩和检验。

Wilcoxon符号秩和检验的步骤如下图所示。步骤1:判断是否为配对设计;步骤2:判断差值是否为正态分布;步骤3:对差值进行编秩;步骤4:计算T值,确定P值,做出推断。

差值编秩,即从小到大对样本进行编秩次,然后再对秩次进行相应的统计学计算,得到相应的P值

二 Wilcoxon符号秩和检验

Wilcoxon符号秩检验(Wilcoxon signed-rank test),也称符号秩和检验,其基本思想是假定配成对子的两种处理效应相同,即其差值的总体分布应为对称分布,且差值的总体中位数为0。

H0:差值的总体中位数Md=0

H1:差值的总体中位数Md≠0

α=0.05

具体思路如下:

计算配对两样本间的差值;

将差值的绝对值按照从小到大转换成秩次,差值为0的对子数不予编秩,差值的绝对值相等的对子数取平均秩;

分别求正秩和负秩的和;

任取正秩或负秩的和作为秩和检验的统计量T;

当n≤50时,查T界值表,查表确定相应的P值从而做出相应判断,P<0.05时,则拒绝原假设认为该配对样本之间有差异。当n>50时,用正态近似法做μ检验,以μ值作为判断标准。

三 SPSS Wilcoxon符号秩和检验

1. 生成差值变量

Wilcoxon signed-rank检验是针对配对变量差值进行假设检验的,所以生成差值变量十分重要。

在主界面点击转换→计算变量,弹出计算变量对话框。在 目标变量栏输入“difference6I”,生成新变量的变量名。接着在数字表达式栏输入“CI_10 - CI_6_IN”,计算新变量值,如下图:

点击确定,数据视图生成一列新变量“difference6I”。

 2. 生成中位数

在主界面点击分析→比较平均值→平均值

 

 弹出平均值对话框后,将CI_10、CI_6_IN和difference6I变量放入因变量列表栏。并,点击选项选项,将中位数放入单元格统计栏,去掉单元格统计栏对平均值、个案数和标准差的选择,点击继续→确定。

 3. Wilcoxon signed-rank检验的SPSS操作

在主界面点击分析→非参数检验→旧对话框→2个相关样本。

 

 弹出对话框双关联样本检验,将CI_10和CI_6_IN变量放入到检验对,确定

4. 结果分析

 P<0.05时,有统计意义,拒绝假设,两样本之间有差异。

本研究Wilcoxon signed-rank检验的Z=-2.04,P<0.05, 按照α=0.05的水准,拒绝原假设,接受备择假设,说明两组数据中位数差值与0的差异具有统计学意义,即CI_10与CI_6_IN不同。

四 判断差值是否满足正态分布 --- spss

1 使用分析>描述统计>探索进行正态分布验证。

2 选择因变量列表,勾选带检验的整体图,确定3。

 

 3 结果分析

查看正态性检验结果,由于样本数较小,以K-S结果为准,显著性=0.02<0.05,不服从正态分布,如果显著性 >0.05,则服从正态分布

查看Q-Q图进一步确认,由图可见基本在直线附近,可以认为服从正态分布。

 

 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
了解您的问题后,我可以给出如下的 Python 统计学处理方法,以检验房间数、酒店实住间夜、酒店直销间夜与酒店直销订单之间的关系: 1. 首先,我们需要确定一个零假设和一个备择假设,以确定需要检验的类型。假设零假设为“酒店实住间夜、酒店直销间夜和酒店直销订单之间没有显著的关系”,备择假设为“酒店实住间夜、酒店直销间夜和酒店直销订单之间存在显著关系”。 2. 然后,我们需要确定使用哪种统计检验方法。因为我们需要检验多个变量之间的关系,所以可以使用方差分析(ANOVA)方法。在 Python 中,可以使用 scipy.stats 模块中的 f_oneway() 方法进行方差分析。 3. 接下来,我们需要准备好数据集。可以使用 pandas 模块读取并处理酒店相关数据,例如: ```python import pandas as pd # 读取数据集 hotel_data = pd.read_csv('hotel_data.csv') # 提取房间数、实住间夜、直销间夜和直销订单数据 room_num = hotel_data['room_num'] live_nights = hotel_data['live_nights'] direct_sales_nights = hotel_data['direct_sales_nights'] direct_sales_orders = hotel_data['direct_sales_orders'] ``` 4. 在准备好数据集后,我们可以使用 f_oneway() 方法进行方差分析。代码如下: ```python from scipy.stats import f_oneway # 进行方差分析 f_statistic, p_value = f_oneway(live_nights, direct_sales_nights, direct_sales_orders) # 输出结果 print('F统计量 =', f_statistic) print('p值 =', p_value) ``` 5. 最后,我们需要根据 p 值来判断是否拒绝零假设。如果 p 值小于预设的显著性水平(例如 0.05),则说明我们可以拒绝零假设,即酒店实住间夜、酒店直销间夜和酒店直销订单之间存在显著关系。如果 p 值大于预设的显著性水平,则说明我们不能拒绝零假设,即酒店实住间夜、酒店直销间夜和酒店直销订单之间没有显著关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值