![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pytorch
文章平均质量分 77
静待梅花开
一碟小菜
展开
-
deepspeed训练微调脚本
deepspeed训练微调脚本原创 2024-02-06 10:39:42 · 630 阅读 · 0 评论 -
上手Pytorch分布式训练DDP
DDP单机单卡"""train_single_gpu.py Adapted from https://github.com/wmpscc/CNN-Series-Getting-Started-and-PyTorch-Implementation"""import torchimport torchvision.transforms as transformsimport argparsefrom torch import nn, optimfrom torch.nn import fun原创 2021-11-06 22:52:20 · 1154 阅读 · 4 评论 -
分布式训练DDP的那些坑
DistributedDataParallel(DDP)是个好东西,对小白来说就是坑有点多。原创 2021-02-05 22:37:58 · 2099 阅读 · 2 评论 -
踩坑记:RuntimeError: CUDA error: device-side assert triggered
GAT分类的时候,遇到RuntimeError: CUDA error: device-side assert triggered原因是数据的类别和num_classes不一致造成的。比如我的数据总共有10类,但是类别数是从1-10,而一般的分类程序是从0-9,所以会出现这个问题,将数据类别改成从0开始就好。...原创 2020-06-28 16:54:33 · 7244 阅读 · 2 评论 -
深度学习炼丹常见操作及问题(持续更新)
随手记录在服务器上炼丹可能会遇到的操作或者问题,作为参考资料给大家也给自己参考,免得花费太多时间在找资料上。原创 2020-06-21 14:47:00 · 1099 阅读 · 0 评论 -
目标检测--RFBNet训练自己制作数据集出现loss=nan问题的解决方法
之前用RFBNet进行目标检测,采用的数据集是VOC2007和VOC2012。最近用在自己的数据集进行训练,由于我的数据集格式跟VOC格式不一样,根据网上的经验,我就开始将自己的数据集制作成VOC格式的方便训练。但自己的数据集和标准的数据集质量真心不能比,有很多问题,花费了好多时间在数据处理上。。。我遇到的问题主要是数据集的问题,而RFBNet是基于SSD的,所以SSD的如果出现这个问题大概率是...原创 2020-05-04 13:03:37 · 1592 阅读 · 1 评论 -
真香!VSCode + Anaconda + Remote-SSH在win10下舒服地进行远程Python开发
经我多次配置的经验,简单上手,愉快地debug。整个流程主要有三大步:安装相应软件->安装拓展模块->配置拓展模块。原创 2020-04-30 20:26:10 · 6108 阅读 · 1 评论 -
目标检测--RFBNet环境配置、训练及验证 (血和泪的教训)
关于RFBNet论文地址训练及遇到问题测试结果参考官方代码https://github.com/ruinmessi/RFBNet/issues/13https://blog.csdn.net/wyy13273181006/article/details/103484799?depth_1-utm_source=distribute.pc_relevant.none-task-blog...原创 2020-04-08 14:13:58 · 1790 阅读 · 6 评论 -
Win10+MX250+CUDA10.1+cuDNN+Pytorch1.4安装+测试全过程(吐血)
最近疫情很严重,很多地方不让出门,很多人也都害怕被传染,包括我,咱一学生也出不了太多力,老老实实在家呆着不添乱就是最好的贡献。但是在家呆着实在无聊,学校又延迟开学,想在家做一些深度学习项目练练手(新手上路,大神勿喷哈哈哈),但是无法连上学校实验室服务器,笔记本CPU跑个demo都费劲。我这一想,笔记本不是还有个鸡肋的MX250吗?很好奇MX250和CPU哪个跑更快一点?于是乎就开始了一波操作。。。...原创 2020-02-03 11:57:29 · 33189 阅读 · 71 评论 -
PyTorch踩坑记
pytorch使用常见的问题nn.BatchNorm2d()的问题https://blog.csdn.net/LoseInVain/article/details/86476010很详细地介绍了该方法和可能遇到的坑,先MARK学习学习!奥力给!!!...转载 2020-01-23 15:19:33 · 219 阅读 · 0 评论