使用numpy pandas 读取csv文件及遍历 && 二者处理数据时间对比

 

1  使用numpy 及 pandas 读取csv文件及遍历

    1.1  numpy     

    fin = np.loadtxt(self.path,dtype=np.str,delimiter=',')
    test_dict = {}
    data = fin[1:].tolist()
    for list1 in data:
        name,cid = list1
        test_dict[cid] = name
    print(json.dumps(test_dict,ensure_ascii=False,indent=4))

  1.2 pandas

    data = pd.read_csv(self.path)
    print(data)
    print(data.describe())
    print(data.head(5))   #前5行
    print(data.iloc[0,:])  #第一行所有数据
    print(data.iloc[[1,3,4],:])  #第2 4 6行
    print(data.iloc[:,:]) #所有航所有列
    print(data.loc[:,'cid'])

    for index,row in data.iterrows():
        print(row['cid'],row['name'],type(row['cid']),type(row['name']))

2 使用numpy pandas python原生方法 处理较大数据时的耗时对比

   这部分先简单写下,后续补全。

   制造一份5.5w条的假数据,统计部分列数值的 sum,mean

   numpy cost time:  2.8s

   pandas cost time: 10.2s

   python 原生方法 cost time: 37.6s

   可见numpy 是最快的。

 

我也觉得numpy api用着更顺手,以后常用numpy 算了。。。

  • 3
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值