1.出现KeyError: 'Requested level (family) does not match index name (None)'
这个错误是因为CSV文件中使用的部分出现了空值。如果直接读取一些较大的csv文件,如第一个代码段,那么因为Excel中显示的量仅为一部分,但实际上不是所有值都读取出来了,未显示的部分应该是被定为了NAN空值,因此要使用提取数据的方法去读取数据。
a = pd.read_csv('D:/文件名.csv')#错误示范
comp_dir = Path('D://data')#正确读取
df_test = pd.read_csv(
comp_dir / '文件名.csv',
dtype={
'x1': 'category',
'x2': 'category',
'x3': 'uint32',
},
parse_dates=['date'],
infer_datetime_format=True,
)
df_test['date'] = df_test.date.dt.to_period('D')
df_test = df_test.set_index(['x1', 'x2', 'x3']).sort_index()
2、ValueError: You are trying to merge on period[D] and object columns. If you wish to proceed you should use pd.concat
与第一问的情况不同,我无法合并两个表格的并集,因为出现无名且不完全一致的列,如A的0、1、2和B的0、1。只能使用a = pd.read_csv('D:/文件名.csv')对文件进行保存删除列,再进行合并
sales_oil = pd.merge(sales_oil, oil, on='date', how='left')。
,