#########第二部分###### #偏差图(deviation):
指的是单个特征中的所有值与特定值之间的关系图,他反应的是所有值偏离特定值的距离 #典型的偏差的图:发散性条形图,面积图 #什么时候用到偏差图呢?
1数据探索与数据解读: 探索某一特征的分布,探索该特征偏离某个特定值(均值/方差等)的程度
2 结果展示与报告呈现
#如果你想根据单个指标查看项目的变化情况,并可视化此差异的数量与差异,那发散条形图是一个好的工具,有助于快速区分中组的性能,很直观
import numpy as np
import importlib as mpl
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline ##参数说明 plt.hlines()表示水平的条形图,类似的还有垂直的条形图 #参数说明 y:y轴的索引 xmin:每行的开头 xmax:每行的结尾 colors linestyles label linewidth alpha:色彩的饱和度
import numpy as np
import seaborn as sns
%matplotlib inline
##简单的练习##
#定义数据
x=np.random.rand(10)
x=x-x.mean()
x.sort()
#绘图
plt.hlines(y=range(10),xmin=0,xmax=x,
linewidth=5,
color=['red'if i<0 else 'green' for i in x], #列表推导式
alpha =1 #饱和度越接近1越艳丽
)
#实践
df=pd.read_csv('mtcars.csv')
#数据探索
df.head()
df.info