1. 导入鸢尾属植物数据集
import numpy as np
import pandas as pd
iris=pd.read_csv('iris.csv',index_col=0)
2. 求出鸢尾属植物萼片长度的平均值、中位数和标准差
mean = np.mean(iris.iloc[:, 0])
medium = np.median(iris.iloc[:, 0])
std = np.std(iris.iloc[:, 0])
print('鸢尾属植物萼片长度的平均值为:%6.4f,中位数为:%6.4f,标准差为:%6.4f' % (mean, medium, std))
鸢尾属植物萼片长度的平均值为:5.8433,中位数为:5.8000,标准差为:0.8253
3. 标准化
len_min = min(iris.iloc[:, 0])
len_max = max(iris.iloc[:, 0])
standardized_length = (iris.iloc[:, 0]-len_min)/(len_max-len_min)
4. 鸢尾属植物萼片长度的第5和第95百分位数
percentile = np.percentile(iris.iloc[:,0],[5,95])
print(percentile)
[4.6 7.255]
5. 把iris_data数据集中的20个随机位置修改为np.nan值
np.random.seed(20201201)