python csv文件数据处理

使用pandas库分析athlete_events.csv文件,统计并排序历史上的金牌总数,发现通过sorted函数处理的结果与pandas存在差异,pandas数据更准确。
摘要由CSDN通过智能技术生成

根据athlete_events.csv文件统计历史上金(奖)牌总数最高的三个国家和金(奖)牌数

  1. 使用pandas处理csv文件

    import pandas as pd
    import numpy as np
    from collections import Counter
    #打开csv文件并且只使用第7列和第十四列
    #引号内为athlete_events.csv的地址  根据个人情况修改
    data=pd.read_csv('C:\\Users\\lcega\\Desktop\\athlete_events.csv',usecols=[7,14])
    #数据1取数据中数据项'Medal'为'gold'的数(金银铜牌中的金牌选手)
    data1=data[data['Medal']=='Gold']					
    									
    list=np.array(data1['NOC'])
    #data1['NOC']改为data['NOC'] --> 统计奖牌最高及前三
    #列表list使用array将金牌选手的国籍排列如下
    #['DEN' 'FIN' 'FIN' ... 'NED' 'NED' 'URS']
    result=Counter(list)#Counter函数输出列表中相同的数据的个数
    print(result.most_common(3))#most_common(n)输出列表中数据出现次数最多的前三名
    data.close()
    
    
    #下面是一些基础操作
    # print(data.head())        输出数据前5行
    # print(data.dtypes)        数据的类型
    #print(data.columns)        打印数据所有的列名
    # print(data.columns[2])    打印数
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值