数据可视化
思考】最基本的可视化图案有哪些?分别适用于那些场景?
散点图:用于发现各变量之间的关系。
柱状图:展示多个分类的数据变化和同类别各变量之间的比较情况。
条形图:展示多个分类的数据变化和同类别各变量之间的比较情况。
折线图:展示数据随时间或有序类别的波动情况的趋势变化。
饼图:用来展示各类别占比,比如男女比例。
热力图:以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。
箱型图:用来展示一组数据分散情况,特别用于对几个样本的比较。
#导入相关库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
**柱状图。
**
**matplotlib.pyplot.bar(left, height, alpha=1, width=0.8, color=, edgecolor=, label=, lw=3) Make a bar plot,绘制柱状图。
参数:
left:x轴的位置序列,一般采用arange函数产生一个序列;
height:y轴的数值序列,也就是柱形图的高度,一般就是我们需要展示的数据;
alpha:透明度
width:为柱形图的宽度,一般这是为0.8即可;
color或facecolor:柱形图填充的颜色;
edgecolor:图形边缘颜色
label:解释每个图像代表的含义
linewidth or linewidths or lw:边缘or线的宽度**
sex = text.groupby('Sex')['Survived'].sum()
#柱状图
sex.plot.bar()
plt.title('survived_conut')
plt.show()
折线图
fare_sur = text.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending=False)
fig = plt.figure(figsize=(20, 18))
fare_sur.plot(grid=True)
plt.legend()
plt.show()
分布图
facet = sns.FacetGrid(text, hue="Survived",aspect=3)
facet.map(sns.kdeplot,'Age',shade= True)
facet.set(xlim=(0, text['Age'].max()))
facet.add_legend()