pandas append性能问题

实际场景:向pandas.Dataframe中添加n条数据


利用pandas.append方法一条一条向其中添加数据,很慢(我向pandas.Dataframe中添加16*715条数据,pc跑了一晚上)

解决方法:利用list将数据封装好,然后再一起加入pandas中


测试样例:

import random
import timeit
import pandas as pd


def func1():
	aa = []
	for x in xrange(200):
		aa.append([random.randint(0, 1000) for r in xrange(5)])
	pdaa = pd.DataFrame(aa)


def func2():
	pdbb = pd.DataFrame()
	for y in xrange(200):
		pdbb[y] = pd.Series([random.randint(0, 1000) for r in xrange(5)])


t1 = timeit.timeit(stmt=func1, number=1000)
t2 = timeit.timeit(stmt=func2, number=1000)
print t1, t2




参考文献:http://www.cppblog.com/huyutian/articles/211535.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值