最近在碰到需要将excel中的数据导入python中进行处理时,遇到了一些简单的问题,简单来讲就是表格数据提取的相关操作和关于索引的一些简单操作,下面是一些小经验分享。
1、输出指定行的所有数据
import pandas as pd
filename = 'test1.xls'
data = pd.read_excel(filename)
print(data[data.index == 5]) #输出第五行的所有数据
运行结果为:
日期 新增人数 累计人数 疑似人数
5 2020-01-31 1978.0 9805 15238
还可以通过下面操作达到类似于切片操作的目的:
print(data[(data.index > 1) & (data.index < 5)])
运行结果为:
日期 新增人数 累计人数 疑似人数
2 2020-01-28 1771.0 4628 6973
3 2020-01-29 1458.0 6086 9239
4 2020-01-30 1740.0 7827 12167
2、输出指定列的所有数据
print(data['累计人数']) #内容为列标签
运行结果为:
0 2048
1 2857
2 4628
3 6086
4 7827
5 9805
6 11900
7 14476
8 17373
9 20541
10 24450
11 28139
12 31296
13 34643
Name: 累计人数, dtype: int64
3、输出指定行、列的数据
df = data[data.index == 5] #先将指定行的数据传给df
print(df[['新增人数', '累计人数']]) #再将指定列的数据输出
输出结果为
新增人数 累计人数
5 1978.0 9805
补充
导入Excel文件时,可以指定index_col = ‘日期’,将日期列作为索引列,这样在查找具体日期的具体数据时,显得就比较方便了。
另外,导入Excel文件时,若指定header = None,则第一列不作为表头使用。在查找表中的数据时,可以直接进行data[i][j]来查找指定行指定列的数据的操作。