python数据分析与可视化——第三章实训

该博客主要介绍了鸢尾花数据集的处理过程,包括数据导入、去除索引号、数据类型定义以及统计分析。通过numpy库对数据进行排序、去重,并计算了花瓣长度的和、均值、标准差、最小值和最大值,展示了基础的数据清洗和统计操作。
摘要由CSDN通过智能技术生成

1.导入模块

import csv
import numpy as np

2.获取数据

iris_data=[]
with open("F:\专业课程作业\python时空数据分析与可视化\iris.csv","r") as f:
    #使用csv.reader读取f中的文件
    csv_reader=csv.reader(f)
    #读取第一行各列的标题
    birth_header=next(csv_reader)
    #将数据存入列表中
    for row in csv_reader:
        iris_data.append(row)
iris_data

3.数据清洗:去掉索引号

# 3.数据清洗:去掉索引号
iris_list=[]
for row in iris_data:
    iris_list.append(tuple(row[1:]))
iris_list

4.数据统计

# 4.数据统计
# (1)创建数据类型
datatype=np.dtype([("Sepal.Length",np.float_),\
                   ("Sepal.Width",np.float_),\
                   ("Petal.Length",np.float_),\
                   ("Petal.Width",np.float_),\
                   ("Species",np.str_,40)])
print(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值