大模型学习-使用colab进行大模型训练

Gratitute_林腾

于 2024-10-11 13:52:16 发布

阅读量428

点赞数 5

分类专栏：大语言模型文章标签：学习语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74462339/article/details/142811542

版权

大语言模型专栏收录该内容

5 篇文章 0 订阅

订阅专栏

目录

什么是colab?

步骤

新建一个文件夹,并命名为colab

在网盘中上传训练要用到的资源:

使用colab

训练

注意：在运行了colab一定时间后，colab会自动断开，如果训练大模型的时间很长（长达几天），是不适合用colab进行训练的

什么是colab?

Colab（全称为Google Colaboratory）是由Google推出的一个基于云的Jupyter Notebook平台，允许用户在线编写和运行Python代码，尤其适合机器学习、数据分析等任务。以下是Colab的几个主要特点：

云端运行：用户无需在本地配置环境，所有代码都可以在Google的服务器上运行，并且提供免费的CPU和GPU资源，方便进行计算密集型任务。
Python支持：Colab主要支持Python，并内置了许多常用的机器学习和数据分析库，如TensorFlow、Keras、NumPy、Pandas等。
自动保存：Colab与Google Drive无缝集成，笔记本文件会自动保存在Google Drive中，方便随时访问和分享。
共享和协作：Colab允许用户轻松地与他人共享代码，并且支持多人协作，类似于Google Docs的共享与实时编辑功能。
GPU和TPU支持：用户可以在Colab中免费使用GPU和TPU资源，加速深度学习模型的训练和推理。

Colab对初学者和有经验的开发者都非常友好，因为它降低了搭建环境的门槛，同时提供了强大的计算能力。

步骤

首先需要有谷歌的账号。且全程需要翻墙

进入谷歌云盘（使用谷歌账户登录）：drive.google.com

新建一个文件夹,并命名为colab

我们可以将要用到的资源放到这个文件夹里，之后使用colab时就可以把该文件夹里的资源挂载过去。如此一来，即使colab断线了，使用的资源仍然在该网盘中，不会造成资源的丢失。

在网盘中上传训练要用到的资源:

注意：上传压缩包，而不是文件夹，否则没有7，8个小时是上传不完的，别问我怎么知道的。并且等上传完后再执行后面的网盘挂载（后面会提到）

可在右下角查看上传的进度：

使用colab

colab的使用类似于在本地的浏览器中操作远端的谷歌云服务器。

新建一个colab页面：

在刚开始时，没有colab选项，我们需要点击连接更多应用

搜索colab,并点击下载：

之后会绑定谷歌账户，跟着引导操作即可。

下载完成后，点击colab:

重命名一下

默认情况下，它使用的是CPU，我们需要改成GPU：

选择连接到托管运行：

输入命令，查看当前分配的资源：

!nvidia-smi

可以看到，当前分配的GPU内存有15GB左右。

首先查看当前路径

输入命令!pwd

可以看到，当前在content目录下。

训练

挂载谷歌网盘

import os
from google.colab import drive
drive.mount('/content/drive')

进入colab目录

%cd /content/drive/MyDrive/colab

解压just_train.zip（这里大概要花十几分钟，耐心等待）

!unzip just_train.zip

解压完成后，进入just_train目录

%cd just_train

执行训练

！./train.sh

成功！！这里面进度条的2000指的是迭代的次数，而不是训练数据的条数。

Gratitute_林腾

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Gratitute_林腾 CSDN认证博客专家 CSDN认证企业博客

码龄2年

396: 原创

8388: 周排名

6626: 总排名

13万+: 访问

: 等级

5857: 积分

1264: 粉丝

1781: 获赞

14: 评论

1307: 收藏

私信

关注

热门文章

分类专栏

大语言模型 5篇
若依框架 16篇
python 21篇
JavaWeb 42篇
Linux 37篇
Java设计模式 4篇
unity 56篇
操作系统 2篇
Redis 22篇
按键精灵 4篇
Java基础知识 33篇
办公软件 5篇
爬虫 28篇
windows 2篇
vue 57篇
前端 4篇
微服务 22篇
neo4j 4篇
Spring Security 4篇
git 6篇
C4d 8篇
docker 15篇
javascript 1篇
AE 18篇
pr 3篇
ps 3篇
NLP自然语言处理 1篇

最新评论

C4d-挤压的一些参数尝试（未完待续）
muyuhwzq: 博主你好纯新手刚入门c4d想问下Mac版的挤压数值为什么和win版的相差很大？拉到6000才和win的800差不多是需要调整哪里吗
爬虫-BeautifulSoup的基本使用
Gratitute_林腾: [code=plain] def img_download(content): print(content) # 解析 soup = BeautifulSoup(content, 'lxml') img_tags = soup.select('div.tupian-list.com-img-txt-list > div > img') src_list = [img['data-original'] for img in img_tags] name_list = [img['alt'] for img in img_tags] print(len(src_list), len(name_list)) for i in range(len(src_list)): name = name_list[i] src = src_list[i] url = 'https:' + src print(url) urllib.request.urlretrieve(url=url, filename='../img/' + name + '.jpg') [/code]
unity-物理材质
ha_lydms: 博文作者真是一位出色的写手！这篇博文让我受益匪浅，语言简洁明了，逻辑严谨有序。作者不仅运用了丰富的例子和引文，为观点提供了充分的支持和验证，还以其独特的视角带给读者全新的思考。
vuex的基本认知
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Vue-路由介绍
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。