如何使用 Google Colab (或其他 python 笔记本)读取谷歌硬盘的文件

  1. 存档和上传

    单独上传大量图像(或文件)需要很长时间,因为 Google Drive 必须为每个图像单独分配ID和属性。建议先归档数据集。

    一种可能的归档方法是将包含数据集的文件夹转换为“.tar”文件。 或者将文件压缩后上传谷歌硬盘

    tar -cvf dataset.tar~ / Dataset # 在 Linux 终端,将文件夹 Dataset 转化为 dataset.tar
    
  2. 安装依赖包

    !pip install PyDrive # 安装一个包
    

    导入必要的库和方法

    import os
    from pydrive.auth import GoogleAuth
    from pydrive.drive import GoogleDrive
    # 以下两句代码在 Google Colab 才需要添加,其他平台忽略
    from google.colab import auth
    from oauth2client.client import GoogleCredentials
    
  3. 授权 Google ADK

    必须授权 Google SDK 从 Colab 访问 Google 云端硬盘

    执行命令

    auth.authenticate_user()
    gauth = GoogleAuth()
    gauth.credentials = GoogleCredentials.get_application_default()
    drive = GoogleDrive(gauth)
    

    收到如下所示的提示。点击链接获取密钥。将其复制并粘贴到输入框中,然后按Enter键。

    在这里插入图片描述

    点击链接登陆后,进行授权。然后把一串字符复制到上面的框里,点击回车即可。

    1545737340245

    对于其他的 jupyter notebook 可以查看 https://pythonhosted.org/PyDrive/quickstart.html 入门指南

  4. 获取您的文件ID

    把文件上传到 Google 云端以后,点击文件获取共享链接

    在这里插入图片描述

  5. 传输内容

从Google云端硬盘下载到Colab

执行以下命令。这里,YOUR_FILE_ID在上一步中获得,DOWNLOAD.tar是您要将文件另存为的名称(或路径)。

download = drive.CreateFile({'id':' YOUR_FILE_ID '})
download.GetContentFile(' DOWNLOAD.tar ')

在这里插入图片描述

下载下来后你可以用 pandas 进行读取或者进行其他操作。

当然,既然可以从 Google 云端下载文件到 Colab,也能从 Colab 上传文件到 Google 云端。

执行以下命令。这里,FILE_ON_COLAB.txtColab 上文件的名称(或路径),**DRIVE.txt **是您要将文件保存为(在Google云端硬盘上)的名称(或路径)。

upload = drive.CreateFile({'title':' DRIVE.txt '})
upload.SetContentFile(' FILE_ON_COLAB.txt ')
upload.Upload()

在这里插入图片描述

我把刚才从云盘下载下来的 result.csv 文件以文件名 result_upload.csv 上传到云端

在这里插入图片描述


以上适合大文件时候使用,如果只是一个 csv 或者 txt 文件,则有更简单的方法。

  1. Google Colab 模块

    Google Colab 具有内置文件模块,可以使用该模块上传或下载文件。通过执行以下命令导入它:

    from google.colab import files
    
  2. 上传

    使用以下命令将文件上载到Google Colab (适用于小文件):

    files.upload()
    

    在这里插入图片描述

    执行完命令后,会出现一个窗口让你上传文件,因为我之前已经有一个 result.csv 文件了,现在它自动给我命名 result(1).csv

  3. 下载

    使用以下命令从 Google Colab 下载文件:

    files.download(' example.txt ')
    

    此功能在Google Chrome中效果最佳。

参考资料:
https://medium.freecodecamp.org/how-to-transfer-large-files-to-google-colab-and-remote-jupyter-notebooks-26ca252892fa

### 回答1: Google Colab可以通过以下方式读取文件: 1. 从Google Drive中读取文件:可以将文件上传到Google Drive中,然后在Colab使用以下代码读取文件: ``` from google.colab import drive drive.mount('/content/drive') # 读取文件 with open('/content/drive/My Drive/example.txt', 'r') as f: print(f.read()) ``` 2. 从本地上传文件:可以使用以下代码上传文件到Colab中: ``` from google.colab import files uploaded = files.upload() # 读取文件 with open('example.txt', 'r') as f: print(f.read()) ``` 注意:上传的文件只能在当前会话中使用,关闭Colab后会被删除。如果需要长期保存文件,建议使用Google Drive。 ### 回答2: Google Colab是一种基于云端运行的工具,可以轻松地进行数据处理,算法实验等。读取文件是其中一个很重要的功能,它可以使用户获取想要的数据并进行后续的处理。下面将简单介绍Google Colab如何读取文件。 1.上传文件 如果用户想要读取本地文件,可以在Colab的左侧面板中选择文件选项卡,然后点击上传按钮使用上传功能上传数据文件。上传完成后,在左侧面板的文件选项卡下选择对应的文件夹,就可以看到已上传的文件。 2.切换至挂载硬盘 如果用户需要读取大量的数据,不希望每次都上传文件,可以考虑将文件挂载到Colab的虚拟机中,这样就可以通过代码读取文件。挂载硬盘的方法如下: (1)执行以下代码块,然后在其中输入授权码,这里演示的是谷歌云端硬盘的操作, ``` from google.colab import drive drive.mount('/content/drive') ``` (2)在弹出的窗口中选择自己的谷歌云端硬盘账户并获取授权码。 (3)授权成功后,在左侧面板的文件选项卡中,可以看到/content/drive下的文件。 3.读取文件 一旦文件上传完成或硬盘挂载完成,就可以使用Python的内置方法读取文件。例如,读取csv文件可以使用以下代码实现。 ``` import pandas as pd data = pd.read_csv('/path/to/your/file.csv') ``` 其中,/path/to/your/file.csv是用户上传的文件的路径。 总之,Google Colab读取文件的方法非常简单,只需要按照以上步骤操作即可。如果用户需要快速读取大量数据,推荐使用挂载硬盘进行操作。 ### 回答3: Google Colab是一种允许用户在云端运行基于Python的程序的工具。在Colab中,用户可以轻松读取各种文件,包括本地计算机上的文件Google Drive上的文件以及在线数据集。 读取本地文件 如果您想在Colab读取本地计算机上的文件,可以使用以下代码: ``` #上传本地文件 from google.colab import files uploaded = files.upload() #读取本地文件 import pandas as pd df = pd.read_csv('example.csv') print(df) ``` 这将使用Colab提供的“文件上传”功能将文件上传到Colab笔记本中。然后,使用Pandas库中的`read_csv()`函数读取文件读取Google Drive上的文件 如果您的文件存储在Google Drive上,可以使用以下代码来读取文件: ``` #连接到Google Drive帐户 from google.colab import drive drive.mount('/content/drive') #读取文件内容 import pandas as pd df = pd.read_csv('drive/My Drive/example.csv') print(df) ``` 这将使用Colab提供的`drive.mount()`函数连接到您的Google Drive帐户。您可以在`drive/My Drive/`路径下找到您的文件。然后,使用Pandas库中的`read_csv()`函数读取文件读取在线数据集 Colab还提供了许多在线数据集,您可以使用以下代码读取其中一个数据集: ``` #导入所需的库 import pandas as pd import io import requests #读取在线数据集 url="https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" s=requests.get(url).content df=pd.read_csv(io.StringIO(s.decode('utf-8')), header=None) print(df.head()) ``` 在本例中,我们使用`requests`库下载数据集,然后使用`StringIO`将其转换为字符流,最后使用Pandas的`read_csv()`函数读取数据集。 总之,Google Colab非常方便地允许用户读取各种文件,无论是本地文件Google Drive上的文件还是在线数据集。关键是了解适当的函数和路径来读取您的文件
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器视觉CV

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值