%matplotlib inline
import pandas as pd
import numpy as np
数据可视化
Pandas 的数据可视化使用 matplotlib 为基础组件。更基础的信息可参阅 matplotlib 相关内容。本节主要介绍 Pandas 里提供的比 matplotlib 更便捷的数据可视化操作。
线型图
Series 和 DataFrame 都提供了一个 plot
的函数。可以直接画出线形图。
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.describe()
#describe表示这个series的信息
'''
count 1000.000000
mean 3.526470
std 16.243923
min -20.683881
25% -9.300320
50% -1.758149
75% 13.224696
max 42.878495
dtype: float64
'''
ts.plot();
#绘制出图形
# ts.plot? for more help
ts.plot(title='cumsum', style='r-', ylim=[-30, 30], figsize=(4, 3));
#图形名字,颜色, y取值,图形大小
df = pd.DataFrame(np.rand