01 提纲
不断总结是学习进步的阶梯。
前阵子针对python数据可视化进行了一波学习和实操,是时候总结一下数据可视化的方法和代码了,一起来复习吧!
想要说明的一点是,方法千千万,是学习不完的,怎么办呢?
最近听到一个词:用以致学。就是以目的为导向去学习,学到之后再进行总结,而不是盲目地学。
本次数据可视化复习提纲如下:
散点图
箱线图
折线图
条形图、直方图
饼图
多图
主要使用到matplotlib.pyplot和seaborn两个python内置绘图包。
下面我们开始吧~
对了,别忘记引入包
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
#设置在notebook中直接展示图形输出
%matplotlib inline
#设置图片清晰度
%config InlineBackend.figure_format="retina"
02 散点图
【.plot作图】
# kind="scatter",做散点图,x轴表示花瓣长度,y轴表示花瓣宽度
iris.plot(kind="scatter",color="red",x="petal_length",y="petal_width")
【matlibplot.pyplot.plot作图】 [plt.plot( )]
plt.style.use('ggplot')
#设置画布大小
plt.figure(figsize=(8,6))
#scatter绘制散点图,s设置点大小
plt.scatter(x=top10.Purchases,y=top10.Sales,s=100)
【seaborn作图】[sns.] v.s. 【.plt作图】
matplotlib是python的主要绘图工具,但其自身的语法比较复杂
Seaborn是基于matplotlib产生的一个模块,专攻于统计可视化
Seaborn和matplotlib的关系类似于pandas和numpy的关系
我们来看看seaborn相较于plt的简洁之处,下面两个代码实现同样的效果——花瓣长宽散点图,以品种划分数据.
seaborn实现
# FacetGrid中的hue参数指明划分数据的变量,这里是species(品种)
# \ 用于将一行语句提行
# add_legend()添加图例
#先将iris数据集以species字段划分开
sns.FacetGrid(iris,hue='species',size=7