数据可视化
Matplotlib
Python中存在一个绘图库matplotlib()方法。使用matplot绘图的基本方式为:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.bar(stacked=True)
#显示所绘制的图
plt.show()
matplotlib可以绘制直方图,散点图等,但是在绘制时需要执行坐标轴等信息,十分繁琐,因此,常见的我们使用pandas自带的plot方法进行绘制
Pandas绘图
在pandas中主要运用的绘图函数为plot函数,常用的绘图图形有:
图形 | 函数 |
---|---|
条形 | bar() |
堆积条形图 | bar(stacked=True) |
水平堆积条形图 | barh(stacked=True) |
直方图 | plot.hist(bins=20) |
每列绘制不同的直方图 | hist(bins=20) |
直方图 | hist |
盒型图 | boxplot |
区域块图形 | area |
散点图 | plot.scatter(x=‘a’, y=‘b’) |
DataFrame.plot函数指定很多的属性
参数 | 说明 |
---|---|
subplots | 将各个DataFrame列绘制到单独的subplot中 |
sharex | 如果subplots=True,则共用同一个x轴,包括刻度和界限 |
sharey | 如果subplots=True,则共用同一个Y轴 |
figsize | 表示图像大小的元组 |
title | 表示图像标题的字符串 |
legend | 添加一个subplot图例(默认为True) |
sort_columns | 以字母表顺序绘制各列,默认使用当前列顺序 |
Series.plot方法的参数如下
参数 | 说明 |
---|---|
label | 用于图例的标签 |
ax | 要在其上进行绘制的matplotlib subplot对象.如果没有设置,则使用当前matplotlib subplot |
style | 将要传给matplotlib的风格字符串(如’ko–’) |
alpha | 图表的填充不透明度(0到1之间) |
kind | 可以是’line’, ‘bar’, ‘barh’, ‘kde’ |
logy | 在y轴上使用对数标尺 |
use index | 将对象的索引用作刻度标签 |
rot | 旋转刻度标签(0到360) |
xticks | 用作x轴刻度的值 |
yticks | 用作y轴刻度的值 |
xlimx | 轴的界限(例如[0,101]) |
ylimy | 轴的界限 |
grid | 显示轴网格线(默认打开) |