前言
当我们得到一组数据的时候,希望从中找到其输出的数据来拟合数据。而其中影响因子最大的数据就是我们需要的。那我们怎么从一组数据中得到其影响的大小呢?
一、环境
系统:window 10
应用:Anaconda3 的 jupyter
二、步骤
1.引入数据
data = load_boston()
dataframe = pd.DataFrame(data['data'])
print("data里的前5行")
print(dataframe.head(5))
dataframe.columns = data['feature_names']#把数字列替换为特征名
print("data里的前5行")
print(dataframe.head(5))
dataframe['price'] = data['target']
print("data里的前5行")
print(dataframe.head(5))
sns.heatmap(dataframe.corr(), annot=True,fmt='.1f')#画热力图,annot表示是否显示数字,corr表示求相关系数
我们可以看到其中绝对值越接近1说明越相关。