幸运的是,DataFrame和Series都有一个plot属性,默认情况下,plot()绘制的是折线图。
因为现在在玩kaggle,所以我就以kaggle上的avocado-prices数据集为例,在jupyter notebook上绘制折线图。先导入数据:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib notebook
data = pd.read_csv('avocado.csv')
data.head()
我在分析均价与时间的关系时用到了折线图,首先画出均价与年份的关系:
Year = data.groupby('year')['AveragePrice'].agg('mean')
print(Year)
Year.plot()
plt.xticks(rotation=0)
plt.title('AveragePrice and Year')
plt.xlabel('Year')
plt.ylabel('AveragePrice')