相关系数说明
相关系数为正,即正相关,代表x越大,y也越大。相关系数为负,代表负相关。相关系数的范围为-1到1。且绝对值越大代表数据离散程度越小,相关性越高。
dataframe求相关系数
df.corr() # 求相关矩阵
从相关矩阵就可看出两列数据的相关程度。
若返回的是一个空dataframe。
则可能是数值类型不是int ,或者float,可以转换类型解决。
df = pd.DataFrame(df, dtype=np.float)
转换某一列的数据类型,还可以用以下方法。
df['A'].astype(int) # 转换为int类型
df['A'] = pd.to_numeric(df['A']) #转换为int类型