相关分析
函数关系:
相关关系:影响不存在方向性,比如身高越高体重越重,但不能说身高增加1cm体重增加2kg
相关分析不具有传递性,A和C相关,B和C相关,A和B不一定相关
相关系数的显著性检验
#1.两两相关性[有相关系数有p值]
correlation=[]
for I in car_corr[['weight','circle','horsepower']].columns:
correlation.append(stats.pearsonr(car_corr['max_speed'],car_corr[I]))
#1.2 仅有p值
from sklearn.feature_selection import f_regression
F,P_value=f_regression(car_corr[['weight','circle','horsepower']],car_corr['max_speed'])
#2. df的相关系数矩阵[只有相关系数,没有p值]
car_corr[['weight','circle','horsepower','Max_speed']].corr()
#2.2
np.corrcoef((car_corr['Weight'],car_corr['circle'],car_corr['horsepower'],car_corr['Max_speed']))
偏相关分析
发动机作为汽车的心脏,对各项指标有影响。因此,在研究其他指标和最高时速指标之间的相关关系是,会不知不觉在变量之间加入发动