单样本t检验:检验单个变量的均值与目标值之间是否存在差异,如果总体均值已知,样本均值与总体均值之间差异显著性检验属于单样本t检验。
金融应用:
原假设为沪深300收益率均值为0,而p值为0.27>0.05(t值为1.1),所以在5%显著性水平下,不能拒绝原假设,推断沪深300的收益率均值为0。
独立样本t检验:用于检验两组服从正态分布的总体均值是否一样,前提是两个样本方差相等。如果两组样本彼此不独立,应该使用配对样本t检验。
金融应用:
原假设为沪深300、中证500样本收益率均值相等,而p值0.88>0.05,所以在5%显著性水平下,不能拒绝原假设,推断沪深300、中证500收益率均值相等。
配对样本t检验:用于两个样本并不互相独立,对两个总体的均值差异进行检验,原假设d=μ1-μ2=0,即假定两个总体均值相等。
金融应用:
原假设为沪深300、中证500样本收益率均值相等,而p值0.7>0.05,所以在5%显著性水平下,不能拒绝原假设,推断沪深300、中证500收益率均值相等。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
def get_data():
#获取沪深300收益率数列
HS300 = pd.read_excel('stocks.xlsx',sheet_name='510300',index_col=0)
# print(HS300)
HS300RET = HS300.loc[:, 'close'].pct_change()
HS300RET = HS300RET[~np.isnan(HS300RET)]
HS300RET = HS300RET * 100
ZZ500 = pd.read_excel('stocks.xlsx',sheet_name='399905',index_col=0)
ZZ500RET = ZZ500.loc[:, 'close'].pct_change()
ZZ500RET = ZZ500RET[~np.isnan(ZZ500RET)]
ZZ500RET = ZZ500RET * 100
return HS300RET,ZZ500RET
hs300,zz500= get_data()
stocks = pd.DataFrame(hs300)
stocks.columns = ['hs300',]
stocks.loc[:,'zz500'] = zz500
hs = stocks.loc[:,'hs300']
zz = stocks.loc[:,'zz500']
#================================#
#单样本t检验,比较hs300收益率均值与0
print(hs300.head(10))
print(stats.ttest_1samp(hs300,0))
#================================#
#================================#
#独立样本t检验
print(stats.ttest_ind(hs300,zz500))
#================================#
#================================#
#配对样本t检验
print(stats.ttest_rel(hs,zz))
#================================#