鸢尾花数据练习
说明:
**iris-20.data, iris-150.data **
在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。
每类收集了50个样本,因此这个数据集一共包含了150个样本。
sepallength:萼片长度
sepalwidth:萼片宽度
petallength:花瓣长度
petalwidth:花瓣宽度
任务一:
1.读出数据,计算四列数据中任一列的 平均值,中位值、标准差、并将其标准化(将其值转为0~1范围内的标准值)。
2.以某列为主关键字,对数组排序
任务二:
1.统计出0列>5.0 3列<2.0的行(统计出0列>6.0 3列>5.0的行)
2.若原始数据中有空值,删除带有空值的行
任务一:1.读出数据,将第0列花萼长度放入数组len中
`import numpy as np`
`iris=np.loadtxt("d:/aa/iris-20.data",delimiter=',',dtype=object) # 由于原始数据有字符型,因此必须加上参数 dtype=object`
`len=iris[:,0] # 读出0列,花萼长度`
`len=np.float64(len) # 转为浮点型`
`print(len)`
`#花萼长度的均值,中位值,标准差`
`print(np.mean(len),np.median(len),np.