Pandas绘图
-
数据可视化
不仅可以加载转换,还可以可视化
-
单变量可视化
包括形图,折线图,直方图,饼图
格式: df对象 或者 Series 对象.plot图形函数(参数)
df对象 或者Series对象.plot(kind='图像名',参数...)
图形: bar: 条形图(柱状图)
:适用于: 类别型数据展 示
-
line: 折线图
适用于: 连续的数值序列
-
area: 面积图
适用于: 多变量. 单变量情况下,面积图 = 对折线图空白部分进行填充.
-
hist: 直方图
适用于: 展示数据的分布情况,要是:均匀的数据,不要发生 数据倾斜.
-
pie: 饼图
适用于: 少量分类 在整体的占比
-
散点图:分析1个变量的变量 会不会影响 另一个变量值
scatter()
应用场景: 数据量相随较小.
唯一值较多
-
蜂巢图: hexbin()
应用场景: 数据量大.少均可
唯一值较多
-
堆叠图: 在柱状图的基础上,把多个分类的信息 堆叠到一起
应用场景: 少量分类的信息 ,双变量情况
baar(stacked=True)
-
面基堆积:area()
应用场景: 少量分类的信息, 双变量,多变量情况
-
折线图: 适用于: 连续的数值序列,双变量, 多变量,观察其实走向.
line()
Seaborn简介
-
Seaborn是基于matplotlib的图形 可视化包.他提供了一种高度交互界面,便于用户能够做出各种有吸引力的统计图表
-
Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能够做出更具有吸引力的图,而使用matplotlib就能制造更多特色的图
-
Seaborn和Panda的API配合的很好,使用DataFrame/Series的数据可以绘图
-
seaborn: statistical data visualization — seaborn 0.13.2 documentation
Seaborn绘图-计数柱状图
-
概述
-
计数图和直方图很像,直方图通过对数据组来描述分布,
-
计数图(条形图)是对离散变量(分类变量)计数.
-
-
实例代码
# 计数图(条形图) #1. 创建画布,坐标轴 fig,ax = plt.subplots(figsize=(12,6)) #2. 绘制计数柱状图,相当于根据day分组,然后再计数,把计数的结果绘制成柱状图,同下面代码效果类似 # sns.countplot(data=tips, x='day') sns.countplot(data=tips, x='day') # tips['day'].value_counts().plot.bar(color=['r','g','b','orange']) # 3.设置图形标题 ax.set_title('技术状图',size=15) # 4.具体的绘图动作 plt.show()
-
密度图(核密度估计)
-
密度图是展示单变量的另一种方法,本质上是通过绘制每个数据点为中心的正态分布,然后消除重叠的图,使曲线下的面积为1来创建的
-
散点图: scatterpolt : data
x
y
hue = 'sex'
regplot() : 绘制拟合回归线
fit_reg 默认是True
fit_ reg=False 可以关掉
-
蜂巢图
-
kinde='hex',加了这个属性就是 蜂巢图, 不加就是散点图.
-
-
2D KDE图
-
一维KDE 只传入x, 或者 只转入Y
-
二维KDE x,y 都传入
-
fill = True 是否填充曲线内的颜色
-
cbar=True 是否显示 右侧的颜色示意条
-
双变量可视化
-
箱线图: 用于显示多种统计信息: 最小值,1/4分位,中位数,3/4分位,最大值,以及离群值(如果有)
-
箱线图读图
-
箱子的中间有一条线,代表了数据的中位数
-
箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1)
-
箱体包含了50%的数据.因此,箱子的高度在一定程度上反映了数据的波动程度
-
上下边缘则代表了该组数据的最大值和最小值
-
IQR = 上四分位数(Q3) + 1.5IQR 大于这个值的就是异常值
-
判断异常值时最大的值 = 上四分位数(Q3) +1.5IQR 大于这个值就是异常值
-
判断异常值时最小值 = 下四分位数(Q1) - 1.5IQR小于这个值的就是异常值
-
-
有时候箱子外部会有一些点, 可以理解为数据中的"异常值"
-
-
-
小提琴图,它是经典的可视化方法,但可能会掩盖数据的分布
-
小提琴图能显示与箱线图相同的值, 小提琴把"箱线"绘成核密度估计,
-
有助于保留数据的更多可视化信息
-
多变量可视化
-
概述
-
绘制多变量数据没有标准的套路
-
如果想在图中包含更多的信息,可以使用颜色,大小和形状来区分它们
-
Seaborn主题和样式
-
概述
-
上面的Seaborn图都采用了默认样式,可以使用sns.set_style函数更改样式
-
该函数只要运行一次,后续绘图的样式都会发生变化
-
Seaborn有5种样式
-
darkgrid 黑色网格(默认)
-
whitegrid 白色网格
-
dark 黑色背景
-
white 白色背景
-
ticks
-
-
-
Seaborn绘图小结
sns.XXXplot(data = df,x = '列名',y='列名',hue='列名')
-
调整绘图区域的大小
-
plt.subplots(figsize=())
-
如果plt.subplots(figsize=())不行,都会有一个height的参数,指定图片的高度 可以通过height 调整图片大小
-
height 高度 aspect宽高比例
-
-