python读取.csv 大文件的解决办法（iterator=true）

最新推荐文章于 2022-07-01 14:29:41 发布

wifi连不上

最新推荐文章于 2022-07-01 14:29:41 发布

阅读量3.8k

点赞数 4

分类专栏： python

本文链接：https://blog.csdn.net/wifi_wuxian/article/details/105313588

版权

python 专栏收录该内容

28 篇文章 2 订阅

订阅专栏

import pandas as pd
import datetime
import warnings
warnings.filterwarnings('ignore')
#数据导入
#调查日期
today = datetime.date.today()  
searchdate = datetime.datetime.strftime(today, "%Y-%m-%d") 
path = r'C:\Users\wuxian\Desktop\\\'
#读取共有多少行数据
with open(r"20200301之前采购数据.csv", encoding="utf-8") as f:
    size = len(f.readlines())
    print("CSV line number: %d" % (size))  

#导入部分数据进行测试，并删除无用字段
reader0 = pd.read_csv(path+'20200301之前采购数据.csv',nrows=1000)
reader0
columns = reader0.dropna(axis=1).columns.tolist()#指定参数iterator = True返回一个可迭代对象TextFileReader ：
reader = pd.read_csv(path+'20200301之前采购数据.csv',iterator=True,chunksize = 100000,usecols = columns)
#法一    
loop = True
chunksize = 10000000
chunks = []
while loop:
    try:
        chunk = reader.get_chunk(chunksize)
        chunks.append(chunk)
    except StopIteration:
        loop = False
        print('Iteration is stopped')
        
        
df = pd.concat(chunks,ignore_index=True)
df.shape
df.tail()

#法二
mylist = []
for i in reader:
    mylist.append(i)
    print(i.shape)
    
finaldf = pd.DataFrame(mylist）
finaldf.shape

wifi连不上

关注

4
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
python读取.csv 大文件的解决办法（iterator=true）

import pandas as pdimport datetimeimport warningswarnings.filterwarnings('ignore')#数据导入#调查日期today = datetime.date.today() searchdate = datetime.datetime.strftime(today, "%Y-%m-%d") path = r'C...
复制链接

扫一扫