实践大作业 (2)

这篇博客使用Python和numpy库对鸢尾花数据集进行分析,包括计算萼片长度的平均值、中位数和标准差,进行数据标准化,查找百分位数,处理缺失值,筛选特定条件的行,计算相关系数,处理分类变量,创建新特征,调整物种比例,并对数据进行排序和查找常见花瓣宽度值。
摘要由CSDN通过智能技术生成
  1. 导入鸢尾属植物数据集,保持文本不变
import numpy as np
iris_type = np.dtype({
   
    "names":["sepallength","sepalwidth","petallength","petalwidth","species"],
    "formats":["f8","f8","f8","f8","U30"]})
iris_data = np.loadtxt("iris.csv", dtype=iris_type,delimiter=',',skiprows=1)
  1. 求出鸢尾属植物萼片长度的平均值、中位数和标准差(第1列,sepallength)
# iris_num=np.array(iris_data[:,0:4],dtype=np.float)
print("鸢尾属植物萼片长度的平均值为",round(np.mean(iris_data["sepallength"]),3),"cm")
print("鸢尾属植物萼片长度的中位数为",round(np.median(iris_data["sepallength"]),3),"cm")
print("鸢尾属植物萼片长度的标准差为",round(np.std(iris_data["sepallength"]),3))
鸢尾属植物萼片长度的平均值为 5.843 cm
鸢尾属植物萼片长度的中位数为 5.8 cm
鸢尾属植物萼片长度的标准差为 0.825
  1. 创建一种标准化形式的鸢尾属植物萼片长度,其值正好介于0和1之间,这样最小值为0,最大值为1(第1列,sepallength)
np.set_printoptions(threshold=20)
(iris_data["sepallength"]-np.mean(iris_data["sepallength"]))/np.std(iris_data["sepallength"])
array([-0.90068117, -1.14301691, -1.38535265, ...,  0.79566902,
        0.4321654 ,  0.06866179])
  1. 找到鸢尾属植物萼片长度的第5和第95百分位数(第1列,sepallength)
np.quantile(iris_data["sepallength"],[
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值