学校要求的做实验,参考老师发的代码。
- 实验目的
1. 了解和掌握透视表进行数据预处理方法
- 实验要求
使用python的pandas进行操作。
涉及知识包括:1.数据框的增删查改;
2.批量读取数据;
3.变量类型的转换;
4.数据框的重塑与合并;
5.生成数据透视表。
- 实验过程
- 导入数据:引入pandas等库对数据进行导入。
- 读取2004年的数据,并且查看前5行数据
- 查看文件末尾的数据:
- 第一列的值为NaN值,需要删掉第一列。
data0.drop("Unnamed: 0",axis=1,inplace=True)
- 并且把第1行的数据切片保存在col_name变量中,并且把这个变量赋值给data.colums实现更改列名。
col_name=data0.iloc[1]
data0.columns=col_name
- 把第0,1,最后一行数据给删掉。
data0.drop([0,1,len(data0)-1],axis=0,inplace=True)
- 在表中增加年份一列,以便把所