机器学习基础之数据科学包(matplotlib)

本文详细介绍了matplotlib数据科学包的使用,包括散点图、折线图、条形图、直方图、饼状图和箱形图等图表的绘制,并探讨了图形优化、颜色和线型设置、面向对象与Matlab风格的区别,以及子图、多图、网格图的创建和坐标轴管理等高级技巧。
摘要由CSDN通过智能技术生成

matplotlib数据科学包

散点图

不相关

import matplotlib.pyplot as plt
import numpy as np
N=10000
x=np.random.randn(N)
y1=np.random.randn(N)
plt.scatter(x,y1,s=1)
plt.show()

在这里插入图片描述

正相关

N=10000
x=np.random.randn(N)
y2=x+np.random.randn(N)*0.5
plt.scatter(x,y2,s=1)
plt.show()

在这里插入图片描述

负相关

N=10000
x=np.random.randn(N)
y3=-x+np.random.randn(N)*0.5
plt.scatter(x,y3,s=1)
plt.show()

在这里插入图片描述

股票分析示例

#读取文件,delimiter表示数据间隔方式,skiprows表示跳过第一行,usecols表示选取第1列和第4列(从0开始),unpack表示单独读取数据
open,close=np.loadtxt('000001.csv',delimiter=',',skiprows=1,usecols=(1,4),unpack=True)
change=close-open
yesterday=change[:-1] #前一天的变化
today=change[1:]  #当天的变化
plt.scatter(yesterday,today,s=1) #画出前一天和当天变化的关系
plt.show()

在这里插入图片描述

折线图

import matplotlib.pyplot as plt
import numpy as np
import matplotlib.dates as mdates
date,open,close=np.loadtxt('000001.csv',delimiter=',',
                           converters={0:mdates.bytespdate2num('%m/%d/%Y')},skiprows=1,usecols=(0,1,4),unpack=True)
plt.plot_date(date,open,linestyle='--',color='b',marker='o')
plt.plot_date(date,close,linestyle='--',color='r',marker='>')
plt.show()

在这里插入图片描述

条形图

无堆叠

import numpy as np
import matplotlib.pyplot as plt
#多组数据并列显示
index=np.arange(4)
sales_BJ=[52,55,63,53]
sales_SH=[44,66,55,41]
bar_width=0.3
#垂直方向
plt.bar(x=index,height=sales_BJ,width=bar_width,color='b')
plt.bar(x=index+bar_width,height=sales_SH,width=bar_width,color='r')
plt.show()
#水平方向
plt.barh(y=index,width=sales_BJ,height=bar_width,color='blue')
plt.barh(y=index+bar_width,width=sales_SH,height=bar_width,color='red')
plt.show()

在这里插入图片描述
在这里插入图片描述

有堆叠

import numpy as np
import matplotlib.pyplot as plt
#多组数据并列显示
index=np.arange(4)
sales_BJ=[52,55,63,53]
sales_SH=[44,66,55,41]
bar_width=0.3
#垂直方向
plt.bar(x=index,height=sales_BJ,width=bar_width,color='b')
plt.bar(x=index,height=sales_SH,width=bar_width,color='r',bottom=sales_BJ)
plt.show()
#水平方向
plt.barh(y=index,width=sales_BJ,height=bar_width,color='blue')
plt.barh(y=index,width=sales_SH,height=bar_width,color='red',left=sales_BJ)
plt.show()

在这里插入图片描述
在这里插入图片描述

直方图

单变量的直方图

import numpy as np
import matplotlib.pyplot as plt

mu=100 #分布的平均值
sigma=20 #分布的标准差
x=mu+sigma*np.random.randn(2000)
#画直方图,bins表示分成的份数,normed 标准化,显示所占比例
plt.hist(x,bins=10,color='red',normed=True)
plt.show()

在这里插入图片描述

双变量的直方图

x=np.random.randn(2000)+1
y=np.random.randn(2000)+5
plt.hist2d(x,y,bins=40)
plt.show()

颜色深浅表示频率的大小

饼状图

import matplotlib.pyplot as plt
import numpy as np

labels='A','B','C','D'
fracs=[15,30,45,10]
#设置explode参数,改变不同部分与圆心的距离,突出显示
explode=[0,0.05,0,0]
#设置x轴与y轴的比例,得到正圆的饼状图
plt.axes(aspect=1)
#autopct显示所占百分比,shadow显示阴影
plt.pie(fracs,explode=explode,labels=labels,autopct='%.1f%%',shadow=True)
plt.show()

在这里插入图片描述

箱形图

在这里插入图片描述

import matplotlib.pyplot as plt
import numpy as np
#设置随机种子
np.random.seed(100)
data=np.random.normal(size=(1000,5),loc=0,scale=1)
labels='A','B','C','D','E'
#sym表示调整异常值的形状,
# whis表示上边缘与上四分位的长度,通过调节可以增加或减少异常值的数目
plt.boxplot(data,labels=labels,sym='o',whis=1)
plt.show()

在这里插入图片描述

图形的优化

颜色

在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt
y=np.arange(1,5)
#用内置颜色
plt.plot(y,color='m')

#用灰色阴影表示,color='0.5'表示灰色的深度
plt.plot(y+1,color='0.5')

#用十六进制的方法
plt.plot(y+2,color='#200351')

#用RGB的方法
plt.plot(y+3,color=(0.5,0.3,0.3))
plt.show()

在这里插入图片描述

点和线的样式

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

y=np.arange(1,5)
plt.plot(y,'k>--')
plt.plot(y+1,'mD:')
plt.plot(y+2,'gp-.')
plt.plot(y+3,'ro-')
plt.show()

在这里插入图片描述

面向对象vsMatlab style

在这里插入图片描述
在这里插入图片描述

pylab方式

from pylab import *
x=arange(0,10,1)
y=randn(len(x))
plot(x,y)
title('pylab')
show()

在这里插入图片描述

面向对象方法

import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.sin(x)
#改成面向对象的方式
fig=plt.figure() #创建一块画布
ax=fig.add_subplot(111)  #创建坐标轴
l,=plt.plot(x,y)
t=ax.set_title('object oriented')
plt.show()

在这里插入图片描述

子图的创建

在这里插入图片描述

import matplotlib.pyplot as plt
import numpy as np

x=np.arange(1,100)

plt.subplot(221)
plt.plot(x,x)

plt.subplot(222)
plt.plot(x,-x)

plt.subplot(223)
plt.plot(x,x*x)

plt.subplot(224)
plt.plot(x,np.log(x))

plt.show()

在这里插入图片描述

多图的创建

import matplotlib.pyplot as plt

fig1=plt.figure()

ax1=fig1.add_subplot(111)

ax1.plot([1,2,3],[3,2,1])

fig2=plt.figure()

ax2=fig2.add_subplot(111)

ax2.plot([1,2,3],[1,2,3])

plt.show()

在这里插入图片描述
在这里插入图片描述

网格图的创建

import matplotlib.pyplot as plt
import numpy as np
y=np.arange(1,5)
plt.plot(y,y*2)
#生成网格图
plt.grid(True,color='g',linestyle='-',linewidth='2')
plt.show()
#Object Oriented  
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.random.randn(len(x))
fig=plt.figure()
ax=fig.add_subplot(111)
l,=plt.plot(x,y)

ax.grid(color='g')

plt.show()

在这里插入图片描述

图例的创建

图例位置的参数
在这里插入图片描述

import matplotlib.pyplot as plt
import numpy as np


x=np.arange(1,11,1)
y=x*x

plt.plot(x,x*2,label='Normal')

plt.plot(x,x*3,label='Fast')

plt.plot(x,x*4,label='Faster')

plt.legend(loc=3,ncol=2) #ncol可以将图例分成两列

plt.show()


#方式2

plt.plot(x,x*2)
plt.plot(x,x*3)
plt.plot(x,x*4)

plt.legend(['Normal','Fast','Faster'])

plt.show()
#OO
import matplotlib.pyplot as plt
import numpy as np
x=np.arange(0,10,1)
y=np.random.randn(len(x))
fig=plt.figure()
ax=fig.add_subplot(111)
l,=plt.plot(x,y)

ax.legend(['ax legend'])

line, =ax.plot(x,y,label='Inline label')

line.set_label('label via method')

ax.legend()

plt.show()

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

坐标轴的范围

import numpy as np
import matplotlib.pyplot as plt
x=np.arange(-10,11,1)
plt.plot(x,x*x)
#用.axis()函数调整,可同时调整x轴和y轴
plt.axis([-1,6,10,70])
plt.show()
#用xlim和ylim单独调整坐标轴
plt.xlim(xmin=-5,xmax=5)
plt.ylim(ymin=0,ymax=100)
plt.show()

在这里插入图片描述
在这里插入图片描述

坐标轴刻度

x=np.arange(1,11,1)
plt.plot(x,x)
#面向对象的方式
ax=plt.gca()  #获取坐标轴
ax.locator_params('x',nbins=20)  #nbins表示刻度的个数
plt.show()

#用plt方式
plt.locator_params('y',nbins=10)
plt.show()

在这里插入图片描述

import matplotlib.pyplot as plt
import matplotlib as mpl
import numpy as np
import datetime

fig=plt.figure()
start=datetime.datetime(2015,1,1)
stop=datetime.datetime(2016,1,1)
delta=datetime.timedelta(days=1)
dates=mpl.dates.drange(start,stop,delta)
y=np.random.rand(len(dates))
ax=plt.gca()
ax.plot_date(dates,y,linestyle='-',marker='')
date_format=mpl.dates.DateFormatter('%Y-%m')  #调整日期的格式
ax.xaxis.set_major_formatter(date_format)
fig.autofmt_xdate()  #设定x轴的间隔与图片大小适应
plt.show()

在这里插入图片描述

添加坐标轴

plt方法

import matplotlib.pyplot as plt
import numpy as np
x=np.arange(2,20,1)
y1=x*x
y2=np.log(x)
plt.plot(x,y1)
plt.twinx()  #添加新的y轴
plt.plot(x,y2,'r')
plt.show()
#添加新的x轴
plt.plot(y1,x)
plt.twiny()  #添加新的坐标轴
plt.plot(y2,x,'r')
plt.show()

在这里插入图片描述

面向对象方法

x=np.arange(2,20,1)
y1=x*x
y2=np.log(x)
fig=plt.figure()
ax1=fig.add_subplot(111)
ax1.plot(x,y1)
ax1.set_ylabel('Y1')
ax2=ax1.twinx()
ax2.plot(x,y2,'r')
ax2.set_ylabel('Y2')
ax1.set_xlabel('Compare Y1 and Y2')
plt.show()

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值