目录
matplotlib数据科学包
散点图
不相关
import matplotlib.pyplot as plt
import numpy as np
N=10000
x=np.random.randn(N)
y1=np.random.randn(N)
plt.scatter(x,y1,s=1)
plt.show()
正相关
N=10000
x=np.random.randn(N)
y2=x+np.random.randn(N)*0.5
plt.scatter(x,y2,s=1)
plt.show()
负相关
N=10000
x=np.random.randn(N)
y3=-x+np.random.randn(N)*0.5
plt.scatter(x,y3,s=1)
plt.show()
股票分析示例
#读取文件,delimiter表示数据间隔方式,skiprows表示跳过第一行,usecols表示选取第1列和第4列(从0开始),unpack表示单独读取数据
open,close=np.loadtxt('000001.csv',delimiter=',',skiprows=1,usecols=(1,4),unpack=True)
change=close-open
yesterday=change[:-1] #前一天的变化
today=change[1:] #当天的变化
plt.scatter(yesterday,today,s=1) #画出前一天和当天变化的关系
plt.show()
折线图
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.dates as mdates
date,open,close=np.loadtxt('000001.csv',delimiter=',',
converters={0:mdates.bytespdate2num('%m/%d/%Y')},skiprows=1,usecols=(0,1,4),unpack=True)
plt.plot_date(date,open,linestyle='--',color='b',marker='o')
plt.plot_date(date,close,linestyle='--',color='r',marker='>')
plt.show()
条形图
无堆叠
import numpy as np
import matplotlib.pyplot as plt
#多组数据并列显示
index=np.arange(4)
sales_BJ=[52,55,63,53]
sales_SH=[44,66,55,41]
bar_width=0.3
#垂直方向
plt.bar(x=index,height=sales_BJ,width=bar_width,color='b')
plt.bar(x=index+bar_width,height=sales_SH,width=bar_width,color='r')
plt.show()
#水平方向
plt.barh(y=index,width=sales_BJ,height=bar_width,color='blue')
plt.barh(y=index+bar_width,width=sales_SH,height=bar_width,color='red')
plt.show()
有堆叠
import numpy as np
import matplotlib.pyplot as plt
#多组数据并列显示
index=np.arange(4)
sales_BJ=[52,55,63,53]
sales_SH=[44,66,55,41]
bar_width=0.3
#垂直方向
plt.bar(x=index,height=sales_BJ,width=bar_width,color='b')
plt.bar(x=index,height=sales_SH,width=bar_width,color='r',bottom=sales_BJ)
plt.show()
#水平方向
plt.barh(y=index,width=sales_BJ,height=bar_width,color='blue')
plt.barh(y=index,width=sales_SH,height=bar_width,color='red',left=sales_BJ)
plt.show()
直方图
单变量的直方图
import numpy as np
import matplotlib.pyplot as plt
mu=100 #分布的平均值
sigma=20 #分布的标准差
x=mu+sigma*np.random.randn(2000)
#画直方图,bins表示分成的份数,normed 标准化,显示所占比例
plt.hist(x,bins=10,color='red',normed=True)
plt.show()
双变量的直方图
x=np.random.randn(2000)+1
y=np.random.randn(2000)+5
plt.hist2d(x,y,bins=40)
plt.show()
颜色深浅表示频率的大小
饼状图
import matplotlib.pyplot as plt
import numpy as np
labels='A','B','C','D'
fracs=[15,30,45,10]
#设置explode参数,改变不同部分与圆心的距离,突出显示
explode=[0,0.05,0,0]
#设置x轴与y轴的比例,得到正圆的饼状图
plt.axes(aspect=1)
#autopct显示所占百分比,shadow显示阴影
plt.pie(fracs,explode=explode,labels=labels,autopct='%.1f%%',shadow=True)
plt.show()
箱形图
import matplotlib.pyplot as plt
import numpy as np
#设置随机种子
np.random.seed(100)
data=np.random.normal(size=(1000,5),loc=0,scale=1)
labels='A','B','C','D','E'
#sym表示调整异常值的形状,
# whis表示上边缘与上四分位的长度,通过调节可以增加或减少异常值的数目
plt.boxplot(data,labels=labels,sym='o',whis=1)
plt.show()
图形的优化
颜色
import numpy as np
import matplotlib.pyplot as plt
y=np.arange(1,5)
#用内置颜色
plt.plot(y,color='m')
#用灰色阴影表示,color='0.5'表示灰色的深度
plt.plot(y+1,color='0.5')
#用十六进制的方法
plt.plot(y+2,color='#200351')
#用RGB的方法
plt.plot(y+3,color=(0.5,0.3,0.3))
plt.show()
点和线的样式
y=np.arange(1,5)
plt.plot(y,'k>--')
plt.plot(y+1,'mD:')
plt.plot(y+2,'gp-.')
plt.plot(y+3,'ro-')
plt.show()
面向对象vsMatlab style
pylab方式
from pylab import *
x=arange(0,10,1)
y=randn(len(x))
plot(x,y)
title('pylab')
show()
面向对象方法
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.sin(x)
#改成面向对象的方式
fig=plt.figure() #创建一块画布
ax=fig.add_subplot(111) #创建坐标轴
l,=plt.plot(x,y)
t=ax.set_title('object oriented')
plt.show()
子图的创建
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(1,100)
plt.subplot(221)
plt.plot(x,x)
plt.subplot(222)
plt.plot(x,-x)
plt.subplot(223)
plt.plot(x,x*x)
plt.subplot(224)
plt.plot(x,np.log(x))
plt.show()
多图的创建
import matplotlib.pyplot as plt
fig1=plt.figure()
ax1=fig1.add_subplot(111)
ax1.plot([1,2,3],[3,2,1])
fig2=plt.figure()
ax2=fig2.add_subplot(111)
ax2.plot([1,2,3],[1,2,3])
plt.show()
网格图的创建
import matplotlib.pyplot as plt
import numpy as np
y=np.arange(1,5)
plt.plot(y,y*2)
#生成网格图
plt.grid(True,color='g',linestyle='-',linewidth='2')
plt.show()
#Object Oriented
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.random.randn(len(x))
fig=plt.figure()
ax=fig.add_subplot(111)
l,=plt.plot(x,y)
ax.grid(color='g')
plt.show()
图例的创建
图例位置的参数
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(1,11,1)
y=x*x
plt.plot(x,x*2,label='Normal')
plt.plot(x,x*3,label='Fast')
plt.plot(x,x*4,label='Faster')
plt.legend(loc=3,ncol=2) #ncol可以将图例分成两列
plt.show()
#方式2
plt.plot(x,x*2)
plt.plot(x,x*3)
plt.plot(x,x*4)
plt.legend(['Normal','Fast','Faster'])
plt.show()
#OO
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.random.randn(len(x))
fig=plt.figure()
ax=fig.add_subplot(111)
l,=plt.plot(x,y)
ax.legend(['ax legend'])
line, =ax.plot(x,y,label='Inline label')
line.set_label('label via method')
ax.legend()
plt.show()
坐标轴的范围
import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-10,11,1)
plt.plot(x,x*x)
#用.axis()函数调整,可同时调整x轴和y轴
plt.axis([-1,6,10,70])
plt.show()
#用xlim和ylim单独调整坐标轴
plt.xlim(xmin=-5,xmax=5)
plt.ylim(ymin=0,ymax=100)
plt.show()
坐标轴刻度
x=np.arange(1,11,1)
plt.plot(x,x)
#面向对象的方式
ax=plt.gca() #获取坐标轴
ax.locator_params('x',nbins=20) #nbins表示刻度的个数
plt.show()
#用plt方式
plt.locator_params('y',nbins=10)
plt.show()
import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as np
import datetime
fig=plt.figure()
start=datetime.datetime(2015,1,1)
stop=datetime.datetime(2016,1,1)
delta=datetime.timedelta(days=1)
dates=mpl.dates.drange(start,stop,delta)
y=np.random.rand(len(dates))
ax=plt.gca()
ax.plot_date(dates,y,linestyle='-',marker='')
date_format=mpl.dates.DateFormatter('%Y-%m') #调整日期的格式
ax.xaxis.set_major_formatter(date_format)
fig.autofmt_xdate() #设定x轴的间隔与图片大小适应
plt.show()
添加坐标轴
plt方法
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(2,20,1)
y1=x*x
y2=np.log(x)
plt.plot(x,y1)
plt.twinx() #添加新的y轴
plt.plot(x,y2,'r')
plt.show()
#添加新的x轴
plt.plot(y1,x)
plt.twiny() #添加新的坐标轴
plt.plot(y2,x,'r')
plt.show()
面向对象方法
x=np.arange(2,20,1)
y1=x*x
y2=np.log(x)
fig=plt.figure()
ax1=fig.add_subplot(111)
ax1.plot(x,y1)
ax1.set_ylabel('Y1')
ax2=ax1.twinx()
ax2.plot(x,y2,'r')
ax2.set_ylabel('Y2')
ax1.set_xlabel('Compare Y1 and Y2')
plt.show()