numpy下大作业
作业数据说明
本次练习使用 鸢尾属植物数据集.\iris.data,在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。
sepallength:萼片长度
sepalwidth:萼片宽度
petallength:花瓣长度
petalwidth:花瓣宽度
- 导入鸢尾属植物数据集,保持文本不变。
import pandas as pd
iris_data = pd.read_excel('.\iris.xlsx')
- 求出鸢尾属植物萼片长度的平均值、中位数和标准差(第1列,sepallength)
import numpy as np
import pandas as pd
iris_data = pd.read_excel('.\iris.xlsx')
a = np.mean(iris_data['sepallength'])
b = np.median(iris_data['sepallength'])
c = np.std(iris_data['sepallength'])
print(a)
print(b)
print(c)
- 创建一种标准化形式的鸢尾属植物萼片长度,其值正好介于0和1之间,这样最小值为0,最大值为1(第1列,sepallength)
import numpy as np
import pandas as pd
iris_data = pd.read_excel('.\iris.xlsx')
a = np.amin(iris_data['sepallength'])
b = np.amax(iris_data['sepallength'])
y = (iris_data['sepallength']-a)/(b-a)
print(y)
- 找到鸢尾属植物萼片长度的第5和第95百分位数(第1列,sepallength)。
import numpy as np
import pandas as pd
iris_data = pd.read_excel('.\iris.xlsx')
a = np.percentile