为什么用Python来统计
到了年底,我们经常要统计一个数据做报告。刚好有一家户外协会,这一年做了很多场的主题徒步活动,年底要统计一下哪位队员参加次数最多,颁个证书、奖章给他们。
传统的做法是将Excel里的报名人员名字汇合到一个表格里,然后统计参加的次数,进行排序,得出参加次数最多的前n名队员。
今年该主题徒步活动共举办20多场,单纯的使用Excel复制黏贴,筛选工作量大,耗时间,容易眼疲劳。这时我们可以考虑用python的Pandas来解决。
每次活动的活动人员名单下载好存放在D盘的data文件夹下
Pandas 功能很强大,而且写好的程序明年年底还可以继续用。
步骤:
1、将data文件夹下的活动人员名单(.xls格式)合并到一个数据里。
2、对合并后的数据进行操作,统计队员参加次数
首先,引入相关模块 :
#导入pandas库import pandas as pdimport os
接着,遍历data文件夹,取得.xls文件的标题,保存到列表里&#