图的用途+panda绘图(三):六边箱图、饼图、矩阵散点图

约定

%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

图的用途+pandas绘图

一、六边箱图 Hexagonal Bin Plot

  • 六边箱图的用途

六边箱图又名高密度散点图,如果数据点太密集,绘制散点图太过密集,六边箱图是更好的选择。

如下类型1,落在颜色最深的那个六边箱上有60个点以上。

  • 类型1:六边箱图
df = pd.DataFrame(np.random.randn(1000, 2), columns=['a', 'b'])
df.plot.hexbin(x='a', y='b', gridsize=10);

png

  • 类型2:
df = pd.DataFrame(np.random.randn(1000, 2), columns=['a', 'b'])
df['b'] = df['b'] = df['b'] + np.arange(1000)
df['z'] = np.random.uniform(0, 3, 1000)
df.plot.hexbin(x='a', y='b', C='z', reduce_C_function=np.max, gridsize=25);

png

二、饼图 Pie plot

  • 饼图的用途

侧重于描述在整个系统中,每个个体所占的权重

  • 类型:饼图
se1 = pd.Series( np.random.rand(4), index=['a', 'b', 'c', 'd'], name='series')
se1.plot.pie(figsize=(6, 6));

png

  • 类型2:多饼图
df = pd.DataFrame(3 * np.random.rand(4, 2), index=['a', 'b', 'c', 'd'], columns=['x', 'y'])
df.plot.pie(subplots=True, figsize=(9, 4));

png

  • 类型3:带比重饼图
se1.plot.pie(labels=['AA', 'BB', 'CC', 'DD'], colors=['r', 'g', 'b', 'c'],autopct='%.2f', fontsize=20, figsize=(6, 6));

png

  • 类型3:
se2 = pd.Series([0.1] * 4, index=['a', 'b', 'c', 'd'], name='series2')
se2.plot.pie(figsize=(6, 6));

png

三、矩阵散点图

  • 矩阵散点图的用途

散点图可用来描述两个连续型变量间的关系,而矩阵散点图则可以描述多个变量之间的关系

当数据集中包含多个变量,但变量之间的关系未知,可能正相关,或负相关等等,矩阵散点图则能十分直观地表达出各个变量之间的关系。

df = pd.DataFrame(np.random.randn(1000, 4), columns=['a', 'b', 'c', 'd'])
pd.plotting.scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal='kde');

png

谢谢大家的浏览,
希望我的努力能帮助到您,
共勉!

阅读更多
个人分类: Python 数据挖掘
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭