一、基本概念
主要通过一个统计量的计算,通过检查数据样本与原假设之间的一致程度来判断原假设成立的可能性,这个统计量称为检验统计量。
1.原假设和备择假设
- 原假设:观察到的差异只反映机会变异,记作H0(无显著性差异)
- 备择假设:观察到的差异是真实的,记作H1(有显著性差异)
2.原理
提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”就是上面提到的H0。经统计学分析后,如发现两组间差异是抽样引起的,则“无效假设”成立,可认为这种差异为不显著。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的。
3.基本步骤
1、建立假设。
2、计算统计检验量。
3、计算p值。
4、将p值大小与显著水平进行比较。
clc;clear;close all;
rng(0); %make the output of randn repeatable
n=10; %sample size n=10
x=randn(1,n)+0.8; %generate the normal distribution
disp(x); %display the value of the samples
%% calculate the t-value
x_bar=mean(x);
s=std(x);
t=x_bar/(s/sqrt(n));
%% calculate the p-value
p = 2 * tcdf(-abs(t), n-1);
%% figure
fig=figure();
x=linspace(-4,4,10001);
y = pdf('T',x,9);
hold on;grid on;box on;
idx=find(x<=-2.261,1,'last');
fill([-4,x(idx),x(idx:-1:1),-4],[0,0,y((idx:-1:1)),0],'c');
idx=find(x>=2.261,1);
fill([4,x(idx),x(idx:end),4],[0,0,y((idx:end)),0],'c');
plot(x,y,'k','linewidth',3);
plot([t,t],[0.05,0.005],'k','linewidth',3);
plot([t+0.05,t],[0.015,0.005],'k','linewidth',3);
plot([t-0.05,t],[0.015,0.005],'k','linewidth',3);
text(t-0.5,0.07,['t=',num2str(t,'%0.2f')],'fontsize',18);
title('t-distribution with df = 9');
xlabel('T');
ylabel('Pr(T)');
legend({['Reject region' char(10) ' with p<0.05']})
set(gca,'Ytick',0:0.1:0.4);
set(gca,'fontsize',18);
set(fig,'Position',[500 200 600 400]);
set(fig,'PaperPositionMode','auto');
print('-dpsc2',fig,'fig2_1.eps');
4.假阳性和假阴性
假设检验中涉及的错误主要有一下两种:
- 第一类错误是指原假设H0成立时,我们错误地拒绝了原假设。p≪∝ 表示原假设H0成立的概率小于显著性水平α。在这种情况下,我们拒绝原假设,但是这里仍有概率为α的可能性会判断错误。这种错误发生的概率称为假阳性概率。换句话说,我们有1-α的概率得出真阴性的结论,称为特异性(specificity)。
- 第二类错误是指当备择假设成立时,我们不能拒绝原假设H0的错误概率。第二类错误发生的概率用β表示,为此真阳性的概率为1-β,也被称为灵敏度(sensitivity)或者统计的效力。
第一类错误发生的概率α和第二类错误发生的概率β之间没有必然联系。但是,通常α值的减小会降低第一类错误发生的概率,并且也会增加第二类错误发生的概率。
5.单尾和双尾检验
-
左尾检验
-
右尾检验
-
双尾检验