pandas读取文件和open读取文件对比速度

最新推荐文章于 2023-06-16 18:10:26 发布

小牛头#

最新推荐文章于 2023-06-16 18:10:26 发布

阅读量2.5k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/qq_41562377/article/details/112985438

版权

python 专栏收录该内容

38 篇文章 0 订阅

订阅专栏

pandas读取文件

starts=time.time()

for file in files[:1]:
    print(file)
    file_paths = os.path.join(root, file)
    print(file_paths)
    list2=[]

    # with open(file_paths,'r') as f:
    #    for row in f:
    #         list2 = [row.split(',')[line] for row in f]
    #         #list2.append(row.split()[0])
    #         app_data[file]=list2

    df_y = pd.read_csv(file_paths, engine='python')[data]

print(app_data)
end=time.time()

在这里插入图片描述

python open读取文件

line=int(data)
# x文件有很多
for root, dirs, files in os.walk(train_file_x):
    # 用第一个文件作为例子
    app_data = pd.DataFrame()

    starts=time.time()

    for file in files[:1]:
        print(file)
        file_paths = os.path.join(root, file)
        print(file_paths)
        list2=[]

        with open(file_paths,'r') as f:
           for row in f:
                list2 = [row.split(',')[line] for row in f]
                #list2.append(row.split()[0])
                app_data[file]=list2

        #df_y = pd.read_csv(file_paths, engine='python')[data]

    print(app_data)

在这里插入图片描述

对比结果：
pandas和python：open 读取同样的文件，花费的效率相差 5倍

所以，提高效率的办法就是用 python：open读取csv文件，然后在转成DataFrame，如果之后需要用DataFrame的话。

小牛头#

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pandas读取文件和open读取文件对比速度

pandas读取文件starts=time.time()for file in files[:1]: print(file) file_paths = os.path.join(root, file) print(file_paths) list2=[] # with open(file_paths,'r') as f: # for row in f: # list2 = [row.split(',')[line] for
复制链接

扫一扫