发生的事情是Excel文件中的第一个“列”作为索引读入,而在CSV文件中它被视为列/系列.
我建议你以另一种方式工作并修改pd.read_csv以读取第一列作为索引.然后使用reset_index将索引提升为一系列:
if uploaded_file.name.endswith('.csv'):
df = pd.read_csv(uploaded_file, usecols=[0,1], index_col=0)
else:
df = pd.read_excel(uploaded_file, header=[0,1], usecols=[0,1])
df = df.reset_index() # this will elevate index to a column called 'index'
这将提供一致的输出,即第一个系列将具有标签’index’,而数据帧的索引将是常规的pd.RangeIndex.
您可以使用调度程序来摆脱笨拙的if / else构造:
file_flag = {True: pd.read_csv, False: pd.read_excel}
read_func = file_flag[uploaded_file.name.endswith('.csv')]
df = read_func(uploaded_file, usecols=[0,1], index_col=0).reset_index()