这里用到的可视化工具采用matplotlib.pyplot包的功能
1.箱线图 boxplot
箱线图作用:可以判别异常值 ,查看数据的分布情况
from matplotlib import pyplot as plt
plt.boxplot(x=train['key'].values,labels='x',whis=1.5)
参数解释 :
x: 接受的是array或者是一系列的向量元素,也就是想展示那一列的箱线图就放这一列的值进来
whis: 实践了下,大概就是定义边界上限,从而将边界外的点定义为异常点。
2. 直方图 hist
直方图作用:查看数据是否符合正态分布
plt.hist(x=train['SalePrice'],bins=100)
plt.show()
参数解释:
bins: 描述的是直方图的柱状数量
3. 柱状图
一般作用:展示多类数据对比或者同类别各变量之间的比较情况。
plt.bar(left=np.arange(12),height= data,width=0.35)
plt.ylabel('isnull_counts')
plt.title('category of null')
plt.show()
参数解释:
left : 表示横杠的x轴坐标的刻度
height:柱状的高度
width :柱状的宽度,默认为0.8