根据athlete_events.csv文件统计历史上金(奖)牌总数最高的三个国家和金(奖)牌数
-
使用pandas处理csv文件
import pandas as pd import numpy as np from collections import Counter #打开csv文件并且只使用第7列和第十四列 #引号内为athlete_events.csv的地址 根据个人情况修改 data=pd.read_csv('C:\\Users\\lcega\\Desktop\\athlete_events.csv',usecols=[7,14]) #数据1取数据中数据项'Medal'为'gold'的数(金银铜牌中的金牌选手) data1=data[data['Medal']=='Gold'] list=np.array(data1['NOC']) #data1['NOC']改为data['NOC'] --> 统计奖牌最高及前三 #列表list使用array将金牌选手的国籍排列如下 #['DEN' 'FIN' 'FIN' ... 'NED' 'NED' 'URS'] result=Counter(list)#Counter函数输出列表中相同的数据的个数 print(result.most_common(3))#most_common(n)输出列表中数据出现次数最多的前三名 data.close() #下面是一些基础操作 # print(data.head()) 输出数据前5行 # print(data.dtypes) 数据的类型 #print(data.columns) 打印数据所有的列名 # print(data.columns[2]) 打印数