一、正态分布检验
from scipy import stats
stats.kstest(s['value'], 'norm', (u, std))
#KstestResult(statistic=0.01441344628501079, pvalue=0.9855029319675546),p值大于0.05为正太分布
二、相关系数的检验
import Pandas as pd
x=[];y=[]
s1=pd.Series(x)
s2=pd.Series(y)
r=s1.corr(s2)
Series.corr(self, other, method='pearson', min_periods=None)
'''
参数说明
method{‘pearson’, ‘kendall’, ‘spearman’} :用来计算相关性的方法,默认为皮尔森相关系数
min_periodsint:可选参数,为了获得有效结果所需要的最小的观察数量
'''
三、显著性检验
pandas中不提供p值的统计,需要采用其他的软件包统计
方差齐次性:stats.levene() ,总参数性方法
方差非齐次性:stats.levene() ,separsman或Kendall非参数性检验
scipy.stats.spearmanr()
correlation, p-value = scipy.stats.pearsonr(x, y)
correlation, p-value = scipy.stats.spearmanr(x, y)
correlation, p-value = scipy.stats.kendalltau(x, y)
四、论文用法
线性回归用于分析趋势之前,首先测试数据是否正态分布
(1)若正态分布,则使用Sci-Kit83 Huber Regressor进行线性回归
(2)若非正态分布,则使用Mann–Kendall test进行非参数检验
参考网址:
https://www.jianshu.com/p/f9304da68d98