python分块读取大数据，避免内存不足

最新推荐文章于 2024-06-04 10:15:25 发布

水木小僧

最新推荐文章于 2024-06-04 10:15:25 发布

阅读量1w

点赞数 1

分类专栏： Python与数据分析 python

本文链接：https://blog.csdn.net/Tony_Stark_Wang/article/details/81367837

版权

python 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

Python与数据分析

8 篇文章 2 订阅

订阅专栏

import pandas as pd
def read_data(file_name):
    '''
    file_name:文件地址
    '''
    inputfile = open(file_name, 'rb')   #可打开含有中文的地址
    data = pd.read_csv(inputfile, iterator=True)
    loop = True
    chunkSize = 1000    #一千行一块
    chunks = []
    while loop:
        try:
            chunk = data.get_chunk(chunkSize)
            chunks.append(chunk)
        except StopIteration:
            loop = False
            print("Iteration is stopped.")
    data = pd.concat(chunks, ignore_index=True)
    #print(train.head())
    return data

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

水木小僧

关注关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
5
评论
python分块读取大数据，避免内存不足

import pandas as pddef read_data(file_name): ''' file_name:文件地址 ''' inputfile = open(file_name, 'rb') #可打开含有中文的地址 data = pd.read_csv(inputfile, iterator=True) loop = True ...
复制链接

扫一扫