首先py的画图都是
xx.plot(kind=’xx’)的形式
这个和R的ggplot后面的geom_xxx比较类似。
但是py弱在图形的整合,例如ggplot里面有个stat,可以直接很方便的进行count,identity等操作,而py的数据集需要喂好了给matplot,不过这样也倒是省时,因为py的groupby本来就不算很麻烦(和R的datatable差不多)。
下面进行柱状图的绘制:
iris.groupby('Species')['Sepal.Length'].sum().plot(kind='bar',
title='Bar',
color='k')
这个相当于R的geom_bar(stat=’count’)
需要首先groupby Species,然后加总Sepal.Length,最后画一个柱状图,Color=K 就是黑色,如图:
同样的,可以用均值加总:
iris.groupby('Species')['Sepal.Length'].mean().plot(kind='bar',
title='Bar-mean',
color='b')
当然可以放两个柱状图一起:
iris.groupby('Species')['Sepal.Length',
'Sepal.Width'].sum().plot(kind='bar',
title='combinebar',
color='by')
这个color就是b和y,中间也没有间隔,这个和R倒是不太一样;
当然,也可以都放上,并旋转坐标轴的标签:
iris.groupby('Species').sum().plot(kind='bar',
title='Identitybar',
rot=1)
其中的rot=1 ,就是旋转xtick
也可以堆叠:
iris.groupby('Species').sum().plot(kind='bar',
title='Stackbar',
stacked=True)
当然可以旋转成水平,通过kind=barh
iris.