使用pandas库中groupby对数据进行统计
实验中经常会得到庞大的数据,有时我们需要对结果中处于某一范围内的数据做一个统计,可以直接在Excel中进行,但很不方便,且不利于后续的处理,这里我们采用pandas库中的groupby工具实现这一任务。
代码展示如下:
from itertools import groupby
import pandas as pd
data = pd.DataFrame(pd.read_excel(r'C:/Users/.../1.xlsx'))
for k, g in groupby(sorted(data['values']), key=lambda x: x//5):
print('{}-{}: {}'.format(k*5, (k+1)*5-1, len(list(g))))
其中:
data = pd.DataFrame(pd.read_excel(r'C:/Users/.../1.xlsx'))
这句代码将数据从excel中读入。