自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 slack订阅github两步走

【代码】slack订阅github两步走。

2025-05-16 16:51:49 142

原创 verl - verl核心代码详解(与令人纠结的batch size)

在RL训练中,我们会遇到各种各样的batch, 眼花缭乱。在这里,我们细致梳理一下这些batch 代表了什么,和它们之间的关系。

2025-04-24 16:40:58 1180

转载 Linux上实时查看GPU 使用、显存占用

nvidia-smi:静态查看GPU使用情况:1代表每隔1秒刷新一次GPU使用情况。

2025-04-16 10:58:36 492

原创 verl - vllm_rollout_spmd.py 详解

rollout 是强化学习中非常重要的环节。我们这里研究对于多模态VQA任务,rollout 过程中究竟发生了什么。

2025-04-11 17:47:52 342

原创 从gitlab上可以拉取,但不可push, 解决方案

从远程分支remote (code分支)向本地 (code分支) 拉取代码的时候,很顺利。

2025-03-07 20:43:55 576

原创 Pytorch Loss计算 - MSE

batch size为4, sequence length 为 20,model dimension 为200. 我们有监督信号和 模型输出. 当前我们想计算和之间的mse loss.

2025-03-04 16:03:42 181

转载 Tmux相关命令

在分离会话后,想重新接入某个会话,执行如下命令。

2025-02-28 10:28:04 103

原创 Linux中加速文件复制传输

linux系统中,我们使用cp批量复制转移文件或者文件夹比较慢。而rsync可以加速转移过程。比如我们想把如下路径下的所有内容转移到. 请执行如下命令或者传输完成后,就可以在下看到我们想传输的文件啦。

2025-02-25 17:31:11 262

原创 Jupyter notebook 添加新的Python解释器路径

Linux ubantu 服务器上使用jupyter notebook,默认的python环境可能不是我们想要的。我们需要自行添加python environment。

2025-01-28 11:54:25 461

转载 添加路径, 以便 Python 能够导入那些目录中的模块。

添加额外的目录路径到 sys.path,以便 Python 能够导入那些目录中的模块。

2025-01-10 17:39:27 30

原创 TinyLlava_Factory 载入预训练模型:No such file or directory: xxx/model-00001-of-00004.safetensors

按理说,model.from_pretrain 方法应该直接从这个bin 文件里导入ckpt数据,为何还会报错呢?这个文件是Qwen2-7B 模型文件内自带的,用于指示ckpt中的参数和safetensors文件的对应关系。因此这次的报错原因是,model.from_pretrain() 一并读取了这个文件,想要根据这里的。事实上,我的pretraining 的language model ckpt 是保存在。,但在代码中修改model保存方法,以safetensor的方式存储。

2024-12-18 16:21:53 547

原创 使用tensorboard可视化训练日志

使用tensorboard可视化训练日志

2024-12-10 16:25:09 234

原创 Linux 对比两个文件的区别

linux 对比两个文件的区别

2024-12-10 16:12:06 127

原创 Linux 杀掉所有python进程

一行命令终止所有python进程

2024-12-10 16:07:00 669

转载 Linux中加速文件删除

linux加速文件删除

2024-12-10 15:58:27 148

原创 Linux上快速压缩与解压缩(zip, tag.gz)

linux 多线程快速压缩与解压缩

2024-12-10 15:46:47 1954

原创 git push与pull冲突

pull和push是git的常用操作。但当如下操作发生时,会产生如下冲突:(1)本地代码train.py发生改动(2)train.py没有被push到远程repo,就尝试从远程repo执行pull操作而这些改动会与从远程仓库拉取的更改产生冲突。Git 不允许直接覆盖你的本地改动,因此需要你先处理这些改动。

2024-12-05 14:42:49 221

原创 如何实现一个本地git repo与两个远程git repo同步

git 为项目管理带来了很大的便利,但有的时候我们需要与不同的远程仓库同步。比如在内网环境下,我们使用gitlab,在公网环境下我们使用github。而本地PC可以同时访问到内网与公网,因此,可以借助本地PC这个媒介,与两个不同环境下的git远程仓库无缝同步,从而提升效率。

2024-12-04 11:01:25 506

原创 ssh 公/私钥配置

t: 密钥类型, 可以选择 dsa | ecdsa | ed25519 | rsa;-f: 密钥目录位置, 默认为当前用户home路径下的.ssh隐藏目录, 也就是~/.ssh/, 同时默认密钥文件名以id_rsa开头. 如果是root用户, 则在/root/.ssh/id_rsa, 若为其他用户, 则在/home/username/.ssh/id_rsa;-C: 指定此密钥的备注信息, 需要配置多个免密登录时, 建议携带;

2024-11-04 11:27:47 2122

原创 使用pycocoeval进行ImageCaption任务评测

ImageCaption任务是CV以及mllm研究中的基础任务。在这个blog中,我们介绍如何使用pycocoevalcap这个package评测模型的captioning能力。

2024-10-25 18:07:22 2375 2

原创 Python基础教程学习笔记(一):基础知识

前言参考教材:[挪]芒努斯.利.海特兰德著的《Python基础教程(第三版)》基本运算方法1.四则运算>>> 1+23>>> 1-2-1>>> 1*22>>>1/20.5#注意,除法运算的结果为小数,即浮点数2.整除运算(1)向下圆整法一:使用双斜杠。这种运算方法得到的是向下圆整的结果。例子如下:>>>10//3 3 #10/3=3.333...,经过向下圆整(即返回数轴上此数左边距离

2021-02-27 19:55:46 572 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除