使用透视表对数据进行预处理。

本文介绍了一次使用Python的pandas库进行数据预处理的实验,涉及数据框操作、读取数据、变量转换、数据透视表生成等,通过处理不同年份的数据并合并,对地名进行规范化,最后展示了数据聚合与过滤的应用。
摘要由CSDN通过智能技术生成

学校要求的做实验,参考老师发的代码。

  • 实验目的

1. 了解和掌握透视表进行数据预处理方法

  • 实验要求

 使用python的pandas进行操作。

涉及知识包括:1.数据框的增删查改;

2.批量读取数据;

3.变量类型的转换;

4.数据框的重塑与合并;

5.生成数据透视表。

 

  • 实验过程
  1. 导入数据:引入pandas等库对数据进行导入。

  1. 读取2004年的数据,并且查看前5行数据

  1. 查看文件末尾的数据:

  1. 第一列的值为NaN值,需要删掉第一列。

data0.drop("Unnamed: 0",axis=1,inplace=True)

  1. 并且把第1行的数据切片保存在col_name变量中,并且把这个变量赋值给data.colums实现更改列名。

col_name=data0.iloc[1]

data0.columns=col_name

  1. 把第0,1,最后一行数据给删掉。

data0.drop([0,1,len(data0)-1],axis=0,inplace=True)

  1. 在表中增加年份一列,以便把所
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值