实验一是处理表格中的缺失值,这里用的是拉格朗日插值法
其中 x为缺失值对应的下标序号为缺失值的插值结果,为非缺失值的下标序号对全部缺失数据依次进行插补,直到不存在缺失值为止
数据补全代码如下:
# 导入pandas数据分析库
import pandas as pd
# 导入lagrange插值函数
from scipy.interpolate import lagrange
# 忽略警告信息
import warnings
warnings.filterwarnings('ignore')
# 输入数据的路径
inputfile = '../data/missing_data.xls'
# 输出数据的路径
outputfile = '../tmp/missing_data_processed.xls'
# 读取数据
data