练习1
• 读取北向.csv 指定 trade_date 为 行索引
• 查看数据的基本信息 有无缺失值 对其缺失值进行处理
• 删除缺失值所在行
• 查看数据的基本信息 查看数据是否清洗完毕
• 标签为 index 这列没啥用 将该列删除
• 观察数据是否有重复行
• 将重复行进行删除
• 将行索引 进行升序
• 将处理好的数据 保存至 北向(副).csv
代码如下:
import pandas as pd
import numpy as np
#读取数据
data = pd.read_csv('/Users/zhongzhiyang/Desktop/20210128-第十二讲-数据清洗及离散化/作业数据/北向.csv',index_col=1)
#查看数据信息
data.info()
#删除含有缺失值的行
data = data.dropna()
#再次查看信息
data.info()
#删除index列
data = data.drop(columns='index')
data
#查看数据是否有重复
data.duplicated()
#删除重复
data = data.drop_duplicates()
data
#将数据进行升序排列
data = data.sort_index()
#保存处理过的数据
data.to_excel('/Users/zhongzhiyang/Desktop/20210128-第十二讲-数据清洗及离散化/作业数据/北向(副).xlsx')
代码执行如下