R中大数据量数据框的合并慎重使用rbind

最近在用R处理百万级的数据,程序本身是线性扫描,可是随着数据量的增加,运行时间却不是线性增加,一度几天都运行不完。

怀疑是其中rbind函数造成的,查询到这篇文章,也说了这个问题

http://blog.sina.com.cn/s/blog_403aa80a0101hqhf.html

R语言 <wbr>慎用rbind

在多次修改算法后,我开始怀疑rbind函数的效率了。

脚本的主要意思比较两种方法的运行时间:

方法1:直接生成data.frame,然后再用rbind拼接data.frame

方法2:先生成向量,再在循环最后使用data.frame生成数据框

结果显示,当数据量增大时,rbind会耗费大量时间,而data.frame可以节约大量时间。”

转载于:https://www.cnblogs.com/hermione820/p/4002628.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值