怎么使用pandas读取较大的CSV文件

参考:python 把几个DataFrame合并成一个DataFrame——merge,append,join,conca
怎么使用pandas读取较大的CSV文件

  • 切割CSV文件
#分割较大的CSV文件
chuck_train = pd.read_csv("./train_set.csv", chunksize=50000)
for i, chuck in enumerate(chuck_train):
    chuck.to_csv('train_out{}.csv'.format(i)) # i is for chunk number of each iteration
  • 分块读取CSV文件
df_train0 = pd.read_csv('./train_out0.csv')#读取训练集数据   #Read CSV (comma-separated) file into DataFrame
df_train1 = pd.read_csv('./train_out1.csv')#读取训练集数据
df_train2 = pd.read_csv('./train_out0.csv')#读取训练集数据
  • 将分块的CSV文件,append到一块
#合并之前分割的数据
df_train = df_train0.append([df_train1,df_train2])

整体运行代码见以下链接:
https://blog.csdn.net/qq_25033587/article/details/82849649

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值