numpy统计分布显示
1、计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。
import numpy#加载numpy包 from sklearn.datasets import load_iris#加载sklearn包 data=load_iris()#读出鸢尾花数据集data print(data)#输出数据 petal_length=numpy.array(list(len[3] for len in data['data']))#鸢尾花花瓣长度的数据 print(petal_length)#输出数据 print(numpy.max(petal_length))#计算鸢尾花花瓣长度的最大值 print(numpy.mean(petal_length))#平均值 print(numpy.median(petal_length))#中值 print(numpy.std(petal_length))#均方差
结果:
2、用np.random.normal()产生一个正态分布的随机数组,并显示出来。
import numpy as np import matplotlib.pyplot as plt mu=10 #期望为10 sigma=5 #标准差为5 num=500 #个数为500 normal_data=np.random.normal(mu,sigma,num) #正态分布的随机数组 print(normal_data) #输出
结果:
3、np.random.randn()产生一个正态分布的随机数组,并显示出来。
s=np.random.random(20) print(s)#输出
结果:
4、显示鸢尾花花瓣长度的正态分布图,曲线图,散点图。
mu=np.mean(petal_length) sigma=np.std(petal_length) num=500 #正太分布图 normal_data=np.random.normal(mu,sigma,num) count,bins,ignored=plt.hist(normal_data,20,normed=True) plt.plot(bins,1/(sigma*np.sqrt(2*np.pi))*np.exp( - (bins-mu)**2/(2*sigma*2)),linewidth=2,color='r') plt.show()
结果:
plt.plot(numpy.linspace(0,150,num=150),petal_length,color='r')#曲线图 plt.show()#输出
结果:
plt.scatter(numpy.linspace(0,150,num=150),petal_length,color='r')#散点图 plt.show()#输出
结果: