本文为我日常工作中常用功能的代码块,可以满足绝大部分文本数据处理的需求。
首先导入常用的包
import pandas as pd
本文假设所使用的excel文件目录为 C:/Users/Administrator/Desktop
名称为 test.xlsx
df 为 定义好的Dataframe格式数据
1 读取excel文件到dataframe中
df = pd.read_excel(r'C:/Users/Administrator/Desktop/test.xlsx')
将本地的excel文件读取成Dataframe格式数据,并命名为df
关于读取本地文件,详情请见Tao:最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel)zhuanlan.zhihu.com
2 将dataframe数据保存到excel中
df.to_excel(r'C:\Users\Administrator\Desktop\test.xlsx',index=False)
index=False表示不带索引输出
3 按照某字符将一列拆分为多行,其余列的数据保持不变
按照'+'拆分A列
df = df.drop('A', axis=1).join(df['A'].str.split('+', expan

本文汇总了使用Pandas进行数据处理的一些常见操作,包括读取Excel文件、保存数据、拆分列、删除特定条件的行、调整列顺序、替换空值、排序、抽取样本等,帮助提升数据处理效率。
最低0.47元/天 解锁文章
163

被折叠的 条评论
为什么被折叠?



