Numpy学习——大作业

这篇博客通过Numpy库对鸢尾属植物数据集进行深入分析,包括求萼片长度的平均值、中位数和标准差,标准化处理,处理缺失值,筛选特定条件的行,创建新特征,计算相关系数,调整样本分布等,全面展示了Numpy在数据处理上的应用。
摘要由CSDN通过智能技术生成

1. 导入鸢尾属植物数据集

import numpy as np 
import pandas as pd
iris=pd.read_csv('iris.csv',index_col=0)

2. 求出鸢尾属植物萼片长度的平均值、中位数和标准差

mean = np.mean(iris.iloc[:, 0])
medium = np.median(iris.iloc[:, 0])
std = np.std(iris.iloc[:, 0])
print('鸢尾属植物萼片长度的平均值为:%6.4f,中位数为:%6.4f,标准差为:%6.4f' % (mean, medium, std))
鸢尾属植物萼片长度的平均值为:5.8433,中位数为:5.8000,标准差为:0.8253

3. 标准化

len_min = min(iris.iloc[:, 0])
len_max = max(iris.iloc[:, 0])
standardized_length = (iris.iloc[:, 0]-len_min)/(len_max-len_min)

4. 鸢尾属植物萼片长度的第5和第95百分位数

percentile = np.percentile(iris.iloc[:,0],[5,95])
print(percentile)
[4.6   7.255]

5. 把iris_data数据集中的20个随机位置修改为np.nan值

np.random.seed(20201201)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值