import pandas as pd
import numpy as np
import os, sys
需求背景:一列是商品的品类,要根据这一列的品类名分拆,以品类名命名各个excel:
category_list=df["category_name"].drop_duplicates()
List=list(category_list)
#文件的下载地址
path="C:/Users/..."
#进入以上地址
os.chdir(path)
for category_name in List:
res=df["BE L1"]==category_name
#以下存储方式是因为原数据中有url链接,直接to_excel会出现超过65530限制
with pd.ExcelWriter('{0}.xlsx'.format(category_name ),engine='xlsxwriter',options={'strings_to_urls': False}) as writer:
df[res].to_excel(writer, index=False)
#原数据没有url链接可以直接:
df[res].to_excel('{0}.xlsx'.format(category_name),index=False)
#index=False是不写入index列