import pandas as pd
data = pd.read_csv(文件位置)
data = pd.DataFrame(data)
'''去掉母公司报表的行'''
try:
list1 = []
for i in range(1000000):
if data.iloc[i,2] == "B":
list1.append(i)
except IndexError:
pass
dataa = data.drop(index=list1)#去掉所在母公司行
dataa.index = range(len(dataa['Typrep']))
time1s =list(dataa['Accper'])
time1s = list(set(time1s))
'''将每一个时间段遍历提取'''
for time1 in time1s:
list_time = []
try:
for i in range(1000000):
if dataa.iloc[i, 1] != time1:
list_time.append(i)
except IndexError:
pass
# print(list_time)
'''去掉不是目标的时间段所在的行'''
new_dataframe =dataa.drop(index=list_time)
# print(new_dataframe)
'''存储'''
new_dataframe.to_csv(fr"文件位置\{time1}.csv")
一般下载下来的报表是不分ab表类型和时间分类的,以上代码可以直接将每个年度的数据分类储存为csv文件供自己使用。