pandas操作excel
最近由于要处理一些excel表格,发现pandas可以免去很多的繁琐的人工劳动,在这里记录一下我所用到的知识。
导入文档
将excel中的工作表导入
filename = '***.xls'
data = pd.read_excel(filename, None)
#此处None的作用是将excel内的所有工作表读入,生成一个字典,否则默认只读入第一个工作表
for sh_name in data.keys():
df = data[sh_name]
print(sh_name)
data = pd.read_excel(filename, None, converters={'账号':str})
#converters可以将长数字转换为字符串类型,避免输出的时候都变成了科学计数法
df = pd.read_excel(filename, sheet_name='Sheet1', converters={'账号':str})
#可以指定打开名为Sheet1的工作表,此时读出的数据为DataFrame类型
对DataFrame进行操作
查看dataframe的行数列数
df.shape()
对DataFrame进行操作
查看dataframe的行数列数
df.shape()
对于dataframe的某一列进行筛选
tmp = df[(df.金额 > 0)]
对列名为金额的列进行筛选,并将得到的dataframe存入tmp中
对于d