# 将excel文件按照指定的行数拆分为文件 # 读取Excel文件 data=pd.read_excel('all_data1.xlsx',sheet_name='Sheet1') # 按照指定行数拆分数据 chunk_size = 4999 chunks=[data[i:i+chunk_size] for i in range(0,data.shape[0],chunk_size)] print(len(chunks)) # 保存拆分后的数据为多个Excel文件 for i,chunk in enumerate(chunks): # print(f'({i},{chunk})') chunk.to_excel(f'{i*5000}_{(i+1)*5000-1}.xlsx',index=False) print('done') index=False表示导入的时候忽略索引值
在Pandas中, shape 属性返回一个元组,包含两个元素,第一个元素表示行数,第二个元素表示列数。因此, df.shape[0] 就表示DataFrame中的行数。这个属性通常用于获取DataFrame的行数,以便进行数据处理和分析。enumerate() 函数是 Python 中的一个内置函数,用于将一个可迭代对象(例如列表、元组、字符串等)转换为一个枚举对象。枚举对象包含了可迭代对象中的每个元素的索引和对应的值,可以方便地在循环中同时获取元素的索引和值。例如:
my_list = ['apple', 'banana', 'cherry']
for index, value in enumerate(my_list):
print(index, value)
这段代码将输出:
0 apple
1 banana
2 cherry