python-绘图-单变量数据分析
利用python 的 pandas、matplotlib、seaborn 进行单变量数据分析并绘制图形
代码
import numpy as np
import pandas as pd
from scipy import stats,integrate
from scipy.stats import *
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(color_codes = True)
np.random.seed(sum(map(ord,"distributions")))
x=np.random.normal(size=100)
#直方图,
#sns.displot(x,color="r",bins=20,kde=False)
#直方图增加趋势线
sns.displot(x,color="r",bins=20,kde=True)
plt.show()
#模拟数据,指定均值和协方差
mean,cov = [0,1],[(1,5),(.5,1)]
data = np.random.multivariate_normal(mean,cov,200)
df = pd.DataFrame(data,columns=["x","y"])
print(df)
#特征和特征之间关系用散点图
sns.jointplot(x="x",y="y",data=df)
plt.show()
#hex图,点太多情况,根据颜色深浅看数据两个变量关系
x,y = np.random.multivariate_normal(mean,cov,1000).T
with sns.axes_style("white"):
sns.jointplot(x=x,y=y,kind="hex",color="k")
plt.show()
总结
根据数据的特点,发现并展现之间要说明的关系,是数据可视化的重要作用。