指定某一列作为拆分依据,pandas如何把一个excel的一个sheet拆分为多个sheet呢?具体思路如下:
1、读取excel文件获取DataFrame对象df。
2、获取指定列的Series对象,去重该指定列得到分类。
3、循环分类对df做布尔判断写入新的excel。
具体实现代码如下:
# -*- coding: utf-8 -*-
import pandas as pd
# 读取excel
df = pd.read_excel('kwd.xlsx')
# 去重指定列的类别
citys = list(df['城市'].drop_duplicates())
with pd.ExcelWriter('kwd_new.xlsx') as excel_writer:
# 循环每一类写入
for city in citys:
bool_df = df['城市'] == city
my_df = df[bool_df]
my_df.to_excel(excel_writer,sheet_name=city,index=False)