python pandas read_csv 迭代器使用方法_将python迭代器输出转换为pandas数据帧的最快方法...

迭代地附加到pandas数据帧并不是最好的解决方案.最好将数据构建为列表,然后将其传递给pd.DataFrame.

import random

import pandas as pd

alpha = list('abcdefghijklmnopqrstuvwxyz')

这里我们创建一个生成器,用它来构造一个列表,然后将它传递给dataframe构造函数:

%%timeit

gen = ((random.choice(alpha), random.randint(0,100)) for x in range(10000))

my_data = [x for x in gen]

df = pd.DataFrame(my_data, columns=['letter','value'])

# result: 1 loop, best of 3: 373 ms per loop

这比创建生成器,构造空数据帧和追加行要快得多,如下所示:

%%timeit

gen = ((random.choice(alpha), random.randint(0,100)) for x in range(10000))

df = pd.DataFrame(columns=['letter','value'])

for tup in gen:

df.loc[df.shape[0],:] = tup

# result: 1 loop, best of 3: 13.6 s per loop

这在构造10000行的13秒内非常慢.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值