首先加载所需要用的python包。如果需要更改颜色,将True改成False
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set(color_codes=True)
第二步导入数据,本文用的数据来自唐白河流域数据,三个水文站69年洪峰流量和水位数据,其中B、C站是A站的上游测站,共69个6维数据。存储在hy.csv文件中。通过pandas导入并展示数据的相关性情况。
#导入本地数据集
df=pd.read_csv(‘D:\桌面\hy.csv’)
#检查前五行数据
df.head()
1、首先来做一个比较简单的分析,即分析这个数据集中第1列和第3列的相关性,也就是Q_A和Q_B。
第一种增加拟合线和置信区间。
代码如下:
#增加拟合线+95%置信区间
sns.jointplot(x =‘Q_A’, y =‘Q_B’, data = df,kind = ‘reg’)
生成图片如下:
第二种可以将点改为蜂窝状的