自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 问题解决:GPU满了但是没有进程

在vscode终端测试代码,确认能运行之后就直接把终端杀掉了,但是显存没有释放,再次挂tmux跑报OOM。69919就是要找到的进程,使用kill -9 69919就可以了。记录以下微调ChatGLM2-6B中遇到的问题。

2023-11-12 23:54:02 182

原创 CUDA SETUP: Something unexpected happened.问题解决

解决方法:千万不要向网上说的那样重新按照CUDA,将bitsandbytes版本降低到0.40.0以下即可,例如pip install bitsandbytes==0.39.0。

2023-11-12 19:10:23 234

原创 记录跑Sentence-Bert中出现的问题和收获

2. 报错torch‘ has no attribute ‘inference_mode‘和AttributeError: module 'torch' has no attribute 'autocast', 实测在另一台服务器上torch版本为2.0.1并不会出现此类问题,能升级最好是通过升级解决。1. 服务器网速太慢的时候在 pip install xx 后面加上 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com.

2023-10-25 15:06:56 80 1

原创 李宏毅视频学习笔记1

在实际学习过程中,我们将整个样本分成了一个个batch,先取第一个batch开始,计算出batch1的Loss,记为L1,计算出此时L1的梯度。以此类推,我们可以对剩余的batch挨个进行这样的操作,依次对θ进行更新。2. 深度学习使用的是类神经网络,输入可以是向量、序列、矩阵,输出可以是数值(regression)、类别(classification)、文本图片。随着网络层数的加深,在训练集上的表现更好,但在测试集上的表现会变差,原因在于过拟合(overfitting)a. 先猜测一下函数的基本形式。

2023-07-23 16:48:00 29

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除