有时候我们需要将时间序列上多个时间点的数据列按顺序合并到一个dataframe中,我们会使用
data = pd.merge(data, data_later, how='left', on=['code'])
这样的代码将数据进行合并
之前再加上一个for循环就可以合并许多天的数据了,但是合并之后会出现这样的问题
列标题是factor_x,factor_y这样的形式,列数少的话我们还能用data.rename一个个改,要是多的话,我们就要考虑用几行代码自动生成1,2,3这样数字形式的列名,代码很简单直接上:
for index in range(1, 1000):
data_later = pd.DataFrame(pd.read_csv(path + onlyfiles[index], error_bad_lines=False, encoding='gbk',
usecols=['code', 'factor_value']))
data = pd.merge(data, data_later, how='left', on=['code'])
data = data.rename(columns={'