dataframe根据一列拆出多个excel

最新推荐文章于 2023-12-31 16:42:42 发布

一个豆

最新推荐文章于 2023-12-31 16:42:42 发布

阅读量453

点赞数

文章标签： python pandas 机器学习

本文链接：https://blog.csdn.net/Viv_Bean/article/details/126177019

版权

import pandas as pd
import numpy as np
import os, sys

需求背景：一列是商品的品类，要根据这一列的品类名分拆，以品类名命名各个excel：

category_list=df["category_name"].drop_duplicates()
List=list(category_list)

#文件的下载地址
path="C:/Users/..."
#进入以上地址
os.chdir(path)

for category_name in List:
    res=df["BE L1"]==category_name 
#以下存储方式是因为原数据中有url链接，直接to_excel会出现超过65530限制
    with pd.ExcelWriter('{0}.xlsx'.format(category_name ),engine='xlsxwriter',options={'strings_to_urls': False}) as writer:
        df[res].to_excel(writer, index=False)

#原数据没有url链接可以直接：
df[res].to_excel('{0}.xlsx'.format(category_name),index=False)
#index=False是不写入index列