pandas读取文件和open读取文件对比速度

pandas读取文件

starts=time.time()

for file in files[:1]:
    print(file)
    file_paths = os.path.join(root, file)
    print(file_paths)
    list2=[]

    # with open(file_paths,'r') as f:
    #    for row in f:
    #         list2 = [row.split(',')[line] for row in f]
    #         #list2.append(row.split()[0])
    #         app_data[file]=list2

    df_y = pd.read_csv(file_paths, engine='python')[data]

print(app_data)
end=time.time()

在这里插入图片描述

python open读取文件

line=int(data)
# x文件有很多
for root, dirs, files in os.walk(train_file_x):
    # 用第一个文件作为例子
    app_data = pd.DataFrame()

    starts=time.time()

    for file in files[:1]:
        print(file)
        file_paths = os.path.join(root, file)
        print(file_paths)
        list2=[]

        with open(file_paths,'r') as f:
           for row in f:
                list2 = [row.split(',')[line] for row in f]
                #list2.append(row.split()[0])
                app_data[file]=list2

        #df_y = pd.read_csv(file_paths, engine='python')[data]

    print(app_data)

在这里插入图片描述

对比结果:
pandas和python:open 读取同样的文件,花费的效率相差 5倍

所以,提高效率的办法就是用 python:open读取csv文件,然后在转成DataFrame,如果之后需要用DataFrame的话。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值