昨天学习了使用pandas模块如何查看Excel工作表“wz”的基本信息。今天学习,转换数字科学计数法格式及提取需要处理的数据,接下来就进入今天的学习吧。
一、转换科学计数法格式
在昨天的学习中,不知道大家有没有发现有列数据是依科学计数法的格式显示的,这是因为这列数字太长,默认这样显示。大家知道在Excel中我们把单元格设置为文本类型来输入这些长数字,在python这种方法同样适用。
在昨天打开“wz”工作表的代码中加入参数converters来指定特定列的数据类型为“str”。
wz = pd.read_excel('光大2020年1月.xls',
sheet_name=1,header=9,
converters={'对方账号':str}) # 强制转换'对方账号'列为str类型
35-1
可以看到converters参数实现了我们想要的结果,要注意的是“=”后面是大括号,括号里内容为:待转换列名:要转换成的数据类型。在这里我又试着把要转换成的数据类型换成int,结果也能让数字完全显示。
二、提取需要数据
在整理数据的过程中发现“账户余额”和“对方账号”列数据不是我们需要。我们可以删除它们吗?当然可以不,在这里我们反其道而行,只提取的有用的数据就可以了。下面提取数据的几种方法。
按索引提取
loc方法可以按索引