1、如何使用自己的数据集
将压缩成 zip 文件的数据集上传以后,该如何使用?可以使用如下命令
!cd [path_to_your_dataset] && unzip -q dataset_name.zip
# 例:我的 MSRA 数据集存放在 /home/aistudio/data/data8888/MSRA.zip
!cd /home/aistudio/data/data8888 && unzip -q MSRA.zip
或者使用自定义的解压文件:
import zipfile
# zip_src: 需要解压的文件路径
# dst_dir: 解压后文件存放路径
def unzip_file(zip_src, dst_dir):
r = zipfile.is_zipfile(zip_src)
if r:
fz = zipfile.ZipFile(zip_src, 'r')
for file in fz.namelist():
fz.extract(file, dst_dir)
else:
print('This is not a zip file !!!')
2、代码文件太大,不能上传
将代码文件压缩成 filename.zip 上传到数据集,然后采用 1 中的方式再将 filename.zip 解压到指定文件夹下
3、在 AI Studio 上持久化安装第三方库
如果需要进行持久化安装,需要使用持久化路径,示例如下:
!mkdir /home/aistudio/external-libraries
!pip install beautifulsoup4 -t /home/aistudio/external-libraries
然后在每次环境启动的时候,运行如下的代码即可:
import sys
sys.path.append('/home/aistudio/external-libraries')