numpy5.练习

该博客使用numpy对鸢尾花数据集进行分析,包括计算萼片长度的平均值、中位数、标准差,进行数据标准化,查找百分位数,处理缺失值,筛选特定条件的行,计算相关系数,替换nan值,分类花瓣长度,计算体积,调整物种比例并排序,以及寻找花瓣宽度的特定值出现位置。
摘要由CSDN通过智能技术生成

numpy5.练习

import numpy as np
filename = r'data.txt'

  1. 导入鸢尾属植物数据集,保持文本不变。
# 1. 导入同时存在数字和文本的数据集,注意第2个参数,最后一个参数去掉第一行
data = np.loadtxt(filename, dtype=object, delimiter=',', skiprows=1)
print(data)

  1. 求出鸢尾属植物萼片长度的平均值、中位数和标准差(第1列,sepallength)。
# 2. 萼片长度的平均值、中位数和标准差(第1列,sepallength)
sepallength = np.loadtxt(filename, dtype=float, delimiter=',', skiprows=1, usecols=[0])
mean = np.mean(sepallength)
median = np.median(sepallength)
std = np.std(sepallength)
print("mean:{}\nmedian:{}\nstd:{}".format(mean, median, std))

  1. 创建一种标准化形式的鸢尾属植物萼片长度,其值正好介于0和1之间,这样最小值为0,最大值为1(第1列,sepallength)。
# 3. 标准化萼片长度,介于0和1之间(第1列,sepallength)
smin = np.amin(sepallength)
smax = np.amax(sepallength)
stdsep = (sepallength - smin) / (smax - smin)
print(stdsep)

  1. 找到鸢尾属植物萼片长度的第5和第95百分位数(第1列,sepallength)。
# 4. 萼片长度的第5和第95百分位数(第1列,sepallength)
seperc = np.percentile(sepallength, 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值