概述
1.数据
ggplot读取的数据格式为pandas中的dataFrame,学习的时候可以使用ggplot自带了数据集。diamonds
movies
meat
mtcars
pageviews
%matplotlib inline #如果用的是jupyter notebook一定不要忘记加这句,pycharm等IDE就不需要
from ggplot import *
diamonds.head(10)
meat.head(10)
2.图层
ggplot的核心思想就是图层的叠加。通常由三部分组成:
数据层:必选的图层
图形层:点阵图还是条形图啊之类的,通常也是必选
修饰层:加标题,坐标注释
举个列子:
ggplot(diamonds, aes(x='carat', y='price')) + geom_point() + ggtitle('My diamonds')
这里的ggplot(diamonds, aes(x='carat', y='price'))就是数据层,该数据层的另一表示方式
ggplot(aes(x='carat', y='price'),data=diamonds)
geom_point()是图形层表示散点图,ggtitle('My diamonds')是修饰层。用“+”表示叠加,后面的图层会叠加到前面的图层。
常用图层
图形层
通常以geom开头的就是图形层,下面介绍几个常用,其他请参考官方Doc.
1.散点图 上面已举例就不再赘述。
2.折现图
ggplot(meat, aes(x='date', y='beef')) + geom_line()
双折线图
ggplot(meat, aes(x='date', y='beef')) + geom_line(color = 'red') + geom_line(aes(x='date', y='pork'), data = meat, color