数据可视化是数据分析中最重要的工作之一。在数据探索阶段,可视化有助于我们了解数据的基本分布与简单规律;在数据分析结果阶段,可视化呈现的结果更加直观、醒目。按照数据之间的关系,我们可以把可视化视图分为四类:比较、联系、构成和分布。数据之间表现的这四种关系主要特点如下:
比较:比较数据间各类别的关系,或者是它们随时间的变化趋势,比如折线图;
联系:查看两个或两个以上变量之间的关系,比如散点图;
构成:每个部分占整体的百分比,或者是随时间的百分比变化,比如饼图;
分布:关注单个变量,或者多个变量的分布情况,比如直方图与散点图。
matplotlib
seaborn
创建图像对象
使用figure函数来创建
输入数据参数
导入数据
在窗口里面绘图与标记内容
线条粗细、颜色、形状、横坐标纵坐标等等
>>> import matplotlib.pyplot as plt # 载入matplotlib的子模块pyplot>>> fig = plt.figure(figsize=(10,8))