colab上传大规模文件采坑记录及解决办法

最近,在玩一个kaggle项目,把代码在colab上面跑。没想到输入文件过大,直接在colab左侧面板那里上传,不一会儿就因为网络断开而作废。离谱的是,断开之后你依然能看到新增了一个文件,名字也和你打算取的名字一样。你满心欢喜地认为你上传成功整个文件了,但是这个文件是不完整的,比如说,文件有1G大小,截止断开之时上传了500M,那么新增的文件其实就只有500M数据,还有一部分根本没传上来!!

解决办法:在google 云端硬盘里上传,大规模文件一般是被压缩的,我上传的是zip压缩格式的文件,如下图,
在这里插入图片描述
然后在colab左侧面板你就能看到这个刚刚上传的文件了,然后读取文件,比如
使用pandas.read_csv(’/content/drive/MyDrive/train.csv.zip’)命令读取你的训练数据集至pandas的表格中。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值