本文为我日常工作中常用功能的代码块,可以满足绝大部分文本数据处理的需求。
首先导入常用的包
import pandas as pd
本文假设所使用的excel文件目录为 C:/Users/Administrator/Desktop
名称为 test.xlsx
df 为 定义好的Dataframe格式数据
1 读取excel文件到dataframe中
df = pd.read_excel(r'C:/Users/Administrator/Desktop/test.xlsx')
将本地的excel文件读取成Dataframe格式数据,并命名为df
关于读取本地文件,详情请见
Tao:最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel)zhuanlan.zhihu.com2 将dataframe数据保存到excel中
df.to_excel(r'C:UsersAdministratorDesktoptest.xlsx',index=False)
index=False表示不带索引输出
3 按照某字符将一列拆分为多行,其余列的数据保持不变
按照'+'拆分A列
df = df.drop('A', axis=1).join(df['A'].str.split('+', expand=True).stack().reset_index(level=1, drop&