1.线形图
import matplotlib.pyplot as plt
s = Series(np.random.randint(0,20,size=10))
#bins默认值是10,值越大,条越细
s.hist(bins=100)
简单的DataFrame图标实例.plot
df = DataFrame(np.random.randint(0,150,size=(5,4)),
columns=['python','java','math','chinese'])
df.plot()
2.柱状图
DataFrame柱状图
#在plot中定义类型为柱状图
df.plot(kind='bar')
#显示为横向柱状图
df.plot(kind='barsh')
读取tips.csv文件
tip = pd.read_csv('./data/tips.csv')
tip.set_index('day',inplace=True)
#将不重要的数据去除掉
tip.drop(axis=1,labels=['1','6'],inplace=True)
tip.iloc[:,1:-1].plot(kind='bar')
3.直方图
random生成随机直方图,调用hist()方法
#bins默认值是10,值越大,条越细
s.hist(bins=100)
np.random.normal()正态分布函数
np.random.normal(loc=15,scale=5,size=1000)
#将nd1和nd2连接起来
nd3 = np.concatenate([nd1,nd2])
nd3
#normal统一的,将数据归一化,解决密度线趴下的问题
s.hist(bins=70,normed=True)
4.散布图
是观察两个一维数据列之间的关系的有效方法
df['C++'] = df['python'].map(lambda x:0.7 * x + 20)
df
scatter需要x和y两个参数,它的作用是进行对比
df.plot(kind='scatter',x='python',y='java')
函数pd.plotting.scatter_matrix(),diagnol:对角线
#散点图可以让我们扎到两列数据之间的关系
#1.如果数据量太小两列数据没有关系,加大数据量,又会形成关系
#2.并不是说数据量越大,两列之间的关系会越明显,在数据过大的情况,关系会发生改变
pd.plotting.scatter_matrix(df,figsize=(12,9),diagonal='kde')