python merge很费内存吗_Python Pandas合并导致内存

我是熊猫的新手,正在尝试合并一些数据子集。我给出了一个具体的例子,但问题是一般性的:它是如何发生的,为什么发生的,我如何解决它?

我加载的数据大约为85兆字节,但我经常看到python会话运行到接近10千兆字节的内存使用量,然后给出一个内存错误。

我不知道为什么会发生这种情况,但这让我很难过,因为我甚至无法开始以我想要的方式查看数据。

以下是我所做的:

导入主数据import requests, zipfile, StringIO

import numpy as np

import pandas as pd

STAR2013url="http://www3.cde.ca.gov/starresearchfiles/2013/p3/ca2013_all_csv_v3.zip"

STAR2013fileName = 'ca2013_all_csv_v3.txt'

r = requests.get(STAR2013url)

z = zipfile.ZipFile(StringIO.StringIO(r.content))

STAR2013=pd.read_csv(z.open(STAR2013fileName))

导入一些交叉引用表STARentityList2013url = "http://www3.cde.ca.gov/starresearchfiles/2013/p3/ca2013entities_csv.zip"

STARentityList2013fileName = "ca2013entities_csv.txt"

r = requests.get(STARenti

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值