python numpy读取csv文件_使用numpy读取csv文件中的主要内存问题

最新推荐文章于 2024-04-07 21:30:40 发布

weixin_39534759

最新推荐文章于 2024-04-07 21:30:40 发布

阅读量151

点赞数

文章标签： python numpy读取csv文件

I grabbed the KDD track1 dataset from Kaggle and decided to load a ~2.5GB 3-column CSV file into memory, on my 16GB high-memory EC2 instance:

data = np.loadtxt('rec_log_train.txt')

the python session ate up all my memory (100%), and then got killed.

I then read the same file using R (via read.table) and it used less than 5GB of ram, which collapsed to less than 2GB after I called the garbage collector.

My question is why did this fail under numpy, and what's the proper way of reading a file into memory. Yes I can use generators and avoid the problem, but that's not the goal.

解决方案import pandas, re, numpy as np

def load_file(filename, num_cols, delimiter='\t'):

data = None

try:

data = np.load(filename + '.npy')

except:

splitter = re.compile(delimiter)

def items(infile):

for line in infile:

for item in splitter.split(line):

yield item

with open(filename, 'r') as infile:

data = np.fromiter(items(infile), float64, -1)

data = data.reshape((-1, num_cols))

np.save(filename, data)

return pandas.DataFrame(data)

This reads in the 2.5GB file, and serializes the output matrix. The input file is read in "lazily", so no intermediate data-structures are built and minimal memory is used. The initial load takes a long time, but each subsequent load (of the serialized file) is fast. Please let me if you have tips!

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39534759

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python2.7读取csv文件_在python2.7中使用numpy读取CSV文件

weixin_34543510的博客

02-03

428

我有以下格式的csv文件：x1 y1 z1 x2 y2 z2 cost1 2 3 4 4 5 60…等等。但是，在写字板中，它的表示方式如下：^{pr2}$基本上，分隔符是'，'。我试图用numpy读取这个csv文件，特别是使用genfromtxt。这是我的代码：import numpy as npimport ...

【Python】将 NumPy 数组导出到 CSV 文件

最新发布

PythonWeb实践

06-17

1328

通过上述示例和扩展知识点，你应该能够掌握将 NumPy 数组导出到 CSV 文件的基本技能，并能够根据需要进行适当的调整。NumPy 是 Python 中一个非常强大的科学计算库，它提供了多维数组对象、派生对象（如掩码数组和矩阵）以及用于快速操作数组的各种例程，包括数学、逻辑、形状操作、排序、选择等。NumPy 数组可以非常方便地用于存储和操作数据，但有时我们可能需要将这些数据导出到 CSV 文件中，以便进行进一步的分析或与其他系统共享。如果你需要对导出的数据进行格式化，可以使用。

参与评论您还未登录，请先登录后发表或查看评论

np读取csv文件_在numpy中读取CSV文件，其中分隔符为“，”

weixin_39730671的博客

12-20

230

I've got a CSV file with a format that looks like this:"FieldName1", "FieldName2", "FieldName3", "FieldName4""04/13/2010 14:45:07.008", "7.59484916392", "10", "6.552373""04/13/2010 14:45:22.010", "6.5...

Numpy数组转换为csv文件

qrx941017的博客

04-07

735

通过使用Numpy的函数，我们可以方便地将Numpy数组保存为csv文件，实现了数据格式的转换。这一操作使得我们可以更方便地与其他软件或平台进行数据交互，为数据分析和处理提供了便利。更多技术文章，全网首发公众号 “极客钛” 锁定 -上午11点。

将NumPy数组转储到csv文件中

asdfgh0077的博客

01-22

7353

有没有办法将NumPy数组转储到CSV文件中？我有一个2D NumPy数组，需要以人类可读的格式转储它。

python numpy读取csv文件_numpy模块处理csv文件

weixin_40006133的博客

12-16

3675

数据：X,Y,NAME,LABEL120.7512427,30.75084798,嘉兴市,2120.0830671,30.89524644,湖州市,80120.574379,30.00700998,绍兴市,140122.202972,29.98754304,舟山市,165121.546246,29.87620299,宁波市,86119.642848,29.08127199,金华市,184118.8...

python numpy读取csv文件_在Python中读取scipy / numpy中的csv文件

05-22

要在Python中使用NumPy读取CSV文件，可以使用`numpy.genfromtxt()`函数。以下是一个简单的示例： ```python import numpy as np # 读取CSV文件 data = np.genfromtxt('data.csv', delimiter=',') # 打印数据 ...

python打开并读取csv文件_Python利用Numpy读取CSV文件绘制股票K线

weixin_39586395的博客

11-23

488

今天测试了一下利用Python绘制股票K线的功能，网上有很多人已经分享了这方面的源码，直接拿来用就可以了，不过我在测试的过程中发现了几个问题：一、matplotlib.finance的问题网上的源码基本上都是这样写的：from matplotlib.finance import quotes_historical_yahoo_ohlc, candlestick_ohlc可是在我的电脑上运行都会提示...

python numpy数组动态写入csv文件_关于python：将NumPy数组转储到csv文件中

weixin_42513215的博客

03-01

4994

有没有办法将一个numpy数组转储到csv文件中？我有一个2d numpy数组，需要以人类可读的格式转储它。numpy.savetxt将数组保存到文本文件中。import numpya = numpy.asarray([ [1,2,3], [4,5,6], [7,8,9] ])numpy.savetxt("foo.csv", a, delimiter=",")这是否优于按维度循环遍历数组？我想是的...

使用Numpy读取CSV文件,并进行行列删除的操作方法

09-20

本篇文章将详细介绍如何使用Numpy读取CSV文件，并进行行列删除的操作。首先，让我们了解如何使用Numpy读取CSV文件。CSV（Comma-Separated Values）是一种常见的数据格式，用于存储表格数据。在Numpy中，我们通常...

python numpy数组动态写入csv文件,在Python中用NaNs将Numpy数组写入CSV

weixin_36102776的博客

12-20

274

I am trying to write 2D numpy array into csv file using np.savetxt.import numpy as npdata = np.array([[0,np.nan,2,3],[4,5,np.nan,7],[8,9,10,np.nan]])np.savetxt("file.csv", data, delimiter=",", fmt='%....

[数据处理] numpy转为csv文件 | 矩阵转为csv文件 | 稀疏矩阵的行列索引提取

qq_31225201的博客

05-11

1698

numpy转为csv文件： matrix_pd = pd.DataFrame(matrix) matrix_pd.to_csv('./save.csv') 矩阵转为csv文件： numpy.savetxt('new.csv', matrix, delimiter=',') 稀疏矩阵稀疏矩阵中，行被压缩了，只有data（数据）、indices（列索引）、indptr （行偏移量）如果相对稀疏矩阵中非零数值的行、列进行提取，（debug时候打印可以看见，但是直接print并不完整） res_dict =

如何将numpy数组存成.csv文件

weixin_39559994的博客

12-26

2万+

这篇文章解释了如何将 NumPy 数组写入 CSV 文件。我们将看：将不同的 NumPy 数组写入 CSV 的语法将 NumPy 数组写入 CSV 的限制保存 NumPy 数组的替代方法让我们开始吧。将 NumPy 数组写入 CSV 您可以使用该np.savetxt()方法来保存… 确保：将“.csv”添加到文件名目的地，然后将分隔符关键字设置为“,” 如果您不使用这两个设置，NumPy 会将您的文件保存为 .txt。稍后再谈。 CSV 文件可能很棒，因为它们是人类可读的。它们还具有易于加载

Numpy读取csv文件

热门推荐

MESSI_JAMES的博客

05-28

7万+

一.利用savetxt函数将数据存储到文件: savetxt(fileName,data) fileName:保存文件路径和名称 data:需要保存的数据 np.savetxt(&quot;exaple.txt&quot;,example) print(&quot;保存完成&quot;) 文件-----&amp;gt;0.000000000000000000e+00 1.000000000000

使用numpy pandas 读取csv文件及遍历 && 二者处理数据时间对比

ch的专栏

05-29

1万+

1 使用numpy 及 pandas 读取csv文件及遍历 1.1 numpy fin = np.loadtxt(self.path,dtype=np.str,delimiter=',') test_dict = {} data = fin[1:].tolist() for list1 in data: name,c...

pandas numpy 简单使用（读取csv文件，多维数组）

gly的博客

10-14

3955

import pandas import numpy #pandas.read_csv 读取csv文件 reade = pandas.read_csv("。。。.csv") #numpy.array dct_data = numpy.array(reade.loc[:, :]) #numpy.ndarray ----numpy类型的ndarry对象，存放多维数组的对象 print(type(dct_data))#<class 'numpy.ndarray'> print(dct_data) p

python读取csv文件的两种方式

Time_Remains的博客

04-09

885

使用numpy读取csv文件（去掉第一行和第一列） #使用numpy读取csv文件（去掉第一行和第一列） import pandas as pd import numpy as np data = np.loadtxt(open("data.csv","rb"),dtype=np.str,delimiter=",") data=data[1:,1:].astype(int)#去掉第一行和第一列 print(data) 使用pandas读取csv文件（去掉第一行和第一列） import pandas as

Numpy-如何正确读取或写入csv

Python进阶专栏《爬虫实战进阶》，《数据分析入门与实战》原创作者

03-07

3086

熟悉pandas的同学，可能都知道pandas保存csv文件，又或是pandas读取csv文件，都很方便。笔者这里想说的是，使用numpy来读取csv文件，或者保存csv文件，甚至比pandas还便捷。而本文，笔者将结合实际例子，带你详细了解numpy保存csv或者读取csv的具体方法，至于需要注意哪些，跟着笔者直接往下看正文。下面直接举个例子，创建一个10行2列，区间为0-100的随机二维数组，一列为英语成绩，另一列为数学成绩，将其保存为csv文件。5. usecols：读取指定的列，用元组组合。

【Python机器学习基础教程8】神经网络用于手写识别

Frank Kong的博客

10-22

397

训练集数据 http://www.pjreddie.com/media/files/mnist_train.csv 测试集数据 https://raw.githubusercontent.com/makeyourownneuralnetwork/makeyourownneuralnetwork/master/mnist_dataset/mnist_test_10.csv 说明：...