Python:读取iris数据集中鸢尾花的萼片,花瓣长度,并对其进行排序、去重、并求出和,累计和,均值,标准差、方差、最大值和最小值

1.导入数据
import numpy as np
import csv
2.获取数据
iris_data=[]
with open("iris.csv") as csvfile:
    csv_reader=csv.reader(csvfile)  #用csv.reader读取csvfile文件
    birth_header=next(csv_reader)   #读取第一行各列标题
    for row in csv_reader:
        iris_data.append(row)
3.数据清理,去掉索引号
iris_list=[]
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list
4.数据统计
(1)创建数据类型
datatype=np.dtype([("Sepal.Length",np.str_,40),
                   ("Sepal.Width",np.str_,40),
                   ("Petal.Length",np.str_,40),
                   ("Petal.Width",np.str_,40),
                   ("Species",np.str_,40)])
datatype
(2)创建二维数组
iris_data=np.array(iris_list,dtype=datatype)
iris_data
(3)将待处理数据的类型转化为float类型
PetalLength=iris_data["Petal.Length"].astype(float)
PetalLength
(4)排序
np.sort(PetalLength)
(5)数据去重
np.unique(PetalLength)
(6)对指定列求和、均值、标准差、方差、最小值及最大值
print("sum:",np.sum(PetalLength))
print("mean:",np.mean(PetalLength))
print("std:",np.std(PetalLength))
print("var:",np.var(PetalLength))
print("min:",np.min(PetalLength))
print("max:",np.max(PetalLength))

运行结果如下:

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值