Python：将大型CSV文件转化为DataFrame

最新推荐文章于 2024-08-01 19:43:30 发布

Anasta198110

最新推荐文章于 2024-08-01 19:43:30 发布

阅读量1.4w

点赞数 13

分类专栏： Python 文章标签： Python DataFrame csv

本文链接：https://blog.csdn.net/Anasta198110/article/details/79590157

版权

之前因为比赛一直在玩DataFrame，处理一些小型数据感觉很是方便。但是今天遇到了一个3.32G大的CSV文件感觉甚是无力，总是报内存错误。上网查找了一些方法感觉都很有启发啊，所以自己整合了一下。并记录下来，以防记性不好的我忘记。

方法一：

with open('C:/Users/asus/Desktop/Python/test.csv') as f:
    for line in f:
        print line

这种方法虽然写起来甚是简便，代码量很少，但是读出来的都是字符串，不易清洗整理和计算，且耗时特别长，足有202s。但是可以一运行就出来东西，可以暂停来观察内容的格式什么的。

方法二：

def read_in_block(file_path):
    BLOCK_SIZE = 1024
    with open(file_path,'r') as f:
        while True:
            block = f.read(BLOCK_SIZE)  
            if block:

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Anasta198110

关注关注

13
点赞
踩
62

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

读取CSV文件，并转换为dataframe格式，最后筛选数据

weixin_39417324的博客

08-01

7090

import os import glob import pandas as pd #定义文件路径 file_dir="./test.csv" #读取CSV 文件 result_csv=pd.read_csv(file_path, error_bad_lines=False, encoding='gb18030',engine='python') #将结果转换成Dataframe格式的数据，Dataframe类似一个表格，columns代表表头的每一列的属性名，我们这里定义的是ABCD四列，注意，这里的A

Spark--【csv格式数据转换为json格式的数据】数据且为dataframe的形式

weixin_72357231的博客

12-31

486

csv格式先转换成JsonRDD的形式，然后再转换成dataframe一行一行的数据格式。以上有那些不懂的小伙伴，扣个1，多的话，我再另开一篇文章，详细讲一下。

5 条评论您还未登录，请先登录后发表或查看评论

python将csv读为dataframe然后转为list

weixin_46713695的博客

07-06

980

python将csv读为dataframe然后转为list

【Pandas】pandas.DataFrame.to_csv详解与实战应用：将DataFrame保存为CSV文件

热门推荐

卫可冬的博客

08-03

6万+

逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。准备好csv文件。 csv_file = &quot;yourfilename.csv&quot; csv_data = pd.read_csv(csv_file, low_memory = False)#防止弹出警告 csv_df = ...

python 转dbf文件为dataframe（CSV）

07-20

python 转dbf文件为dataframe（CSV） python 转dbf文件为dataframe（CSV） python 转dbf文件为dataframe（CSV）

Python Pandas批量读取csv文件到dataframe的方法

09-20

例如，`df=pd.read_csv('filename.csv')`读取名为`filename.csv`的文件。 - 参数`header=None`表示CSV文件中没有列标题，`sep=''`表示分隔符是空格（如果分隔符是逗号，则使用`sep=','`）。 - 通过`names`参数可以...

python将dataframe导出为csv,将大型DataFrame输出到CSV文件的最快方法是什么？

weixin_39759918的博客

12-03

454

For python / pandas I find that df.to_csv(fname) works at a speed of ~1 mln rows per min. I can sometimes improve performance by a factor of 7 like this:def df2csv(df,fname,myformats=[],sep=','):"""# ...

python:pandas合并csv文件的方法(图书数据集成)

09-20

最后，我们使用`to_csv`方法将合并后的数据保存为新的CSV文件`data.csv`，可以指定编码格式，这里选择的是GBK编码。总结来说，Python的Pandas库提供了一种强大的数据合并功能，通过`merge`函数可以轻松地将多个CSV...

python将dataframe导出为csv_Pandas DataFrame如何转换为CSV？详细操作————

weixin_39979516的博客

12-03

1万+

本文概述Pandas的to_csv()函数用于将DataFrame转换为CSV数据。要将CSV数据写入文件, 我们只需将文件对象传递给函数即可。否则, CSV数据以字符串格式返回。句法DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=...

解决 TypeError: 'TextFileReader' object is not subscriptable

沙哈

02-28

7979

使用pandas读物文件报错： Traceback (most recent call last): data[“a”] = data[“a”].astype(str) TypeError: ‘TextFileReader’ object is not subscriptable 报错原因： pandas中read_csv()函数，添加chunksize=n的参数后，返回的文件类型为<cla...

python csv dataframe_python 使用csv.reader和csv.writer读写文件并转换成dataframe格式

weixin_39972996的博客

12-03

760

import csvimport pandas as pd###csv.reader用法'''f=open(r"C:\Users\admin\pycdtest\wanyue\yueeceshi.csv")readeriter=csv.reader(f)for line in readeriter:print(line)'''lines=list(csv.reader(open(r"C:\Users...

Python列表写入csv文件及DataFrame转置操作

weixin_43210097的博客

08-19

1970

简单记录一下，方便行与列的对应转换。 import pandas as pd aaa=[[1,2,3],[4,5,6],[7,8,9]] name=[] for i in range(len(aaa)): name.append('column'+str(i)) test=pd.DataFrame(index=name,data=aaa) print(test) test.to_csv('shiyixia.csv') a=test.iloc[0] test1=pd.DataFrame(te

python对csv文件的操作

纯洁的小魔鬼

01-14

4968

一.numpy模块 1.引入numpy模块 import numpy 一.loadtxt() 读取csv文件对该scv文件操作为例 1.dtype 参数指定读取类型 myMatrix = numpy.loadtxt( "D:\why.csv", dtype=str) print myMatrix 输出; ['Name,age,sex' 'why,18,f...

python csv dataframe_python – 将CSV文件导入为pandas DataFrame

weixin_39793794的博客

12-03

1119

什么是将CSV文件读入pandas DataFrame的Python方式(我可以将其用于统计操作,可以使用不同类型的列等)？我的CSV文件“value.txt”包含以下内容：Date,"price","factor_1","factor_2"2012-06-11,1600.20,1.255,1.5482012-06-12,1610.02,1.258,1.5542012-06-13,1618.07,...