Pandas 简记
在写一点点小脚本,记录一下用到的功能函数,下次就不用再查了
1. 读取与保存Excel文件
读取excel文件
import pandas as pd
path=r"<path of file>"
# 当sheet_name=None 的时候会读取整个表格中所有的sheets
excel=pd.read_excel(sheet_name=None)
访问获取某个sheet
sheet=excel['name_of_sheet']
保存excel文件
通过ExcelWriter保存
# 这里execl 是一个pd中的DataFrame类型数据
# 可以用with语法
with pd.ExcelWriter('filename.xlsx') as writer:
excel.to_excel(writer,sheet_name='<sheet_name>',index=False)
# 参数sheet_name 表示写入表格名字
# 参数index表示时候把序号写入excel表格中
2. 编辑表格DF
访问数据
因为只做了很简单应用,所以也用了比较笨的访问方法
# 访问数据中某一块数据,df是pd中的DataFrame类别数据,和numpy中的切片方法类似
df.iloc[begin_row:end_row,begin_col,endcol]
# 复制某一段数据,deep表示深拷贝
df.copy(deep=True)
# 某一列数据
df_col=df['< col_name or index>']
# 某一行数据
df.iloc['<row_name or index>']
排序表格
可以对表格进行排序,按照某一列,或者按照多列排序
# 参数by表示排序的列关键词,ascending=True表示升序,反之降序,inplace表示修改是否生效
df=df.sort_values(by=['列名'],ascending=True,inplace)
# 表格转置
dfT=df.T
合并表格
# 假设data是一系列[df1,df2,df3...]的DF类数据序列
con=pd.concat(data)# data=[df1,df2,df3...]
# 重新设定表格的序列号
con=con.reset_index(drop=True)
# 重新设定列名
con.columes=col #col=['col1','col2'...] 列名就会被设定成指定的名字