![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
cv
文章平均质量分 88
sage_wang
爱技术,爱音乐,爱运动
展开
-
【分布式训练】单机多卡(一):理论基础
最近由于有模型训练的任务,老板对已有的单机单卡模型训练的时间不满意,觉得炼丹周期太长,让我用单机多卡来对模型训练进行优化加速。这两天看了点知乎、csdn、stackoverflow上面相关的文章和问题,发现里面的坑还不少。今天,我就给大家排排坑,介绍一下如何将已有的模型训练转成单机多卡的形式,来进行分布式训练。1、总分分布式训练分为这几类:l按照并行方式来分:模型并行 vs 数据并行l按照更新方式来分:同步更新 vs 异步更新l按照分布式训练系统架构来分:Parameter Server Arc原创 2021-07-13 21:20:47 · 735 阅读 · 2 评论 -
Ubuntu 16.04 切换 多个 cuda 版本
在安装了多个cuda版本后,可能会遇到版本冲突,或者cuda 版本和torch版本不兼容的情况。这个时候就需要手动切换cuda版本。首先,我们先检查一下当前的cuda版本。然后,在/usr/local/目录下查看自己安装的cuda版本,如下图所示:$ ll /usr/localtotal xxdrwxr-xr-x 12 root root 4096 9月 11 19:49 ./drwxr-xr-x 13 root root 4096 2月 21 2020 ../drwxr-xr-x .原创 2020-09-14 21:13:38 · 5822 阅读 · 1 评论 -
【TensorRT系列】(一)从SSD模型跑起来开始
零、TensorRT简介1、TensorRT的基本功能TensorRT是NVIDIA开发的一个可以在NVIDIA旗下的GPU上进行高性能推理的C++库,是一个高性能推理优化引擎。其核心库是使用c++去加速NVIDIA生产的GPU,具有python API。它可以加速的框架模型有:tensorflow、Caffe、Pytorch、MXNet等。它可以吸收在这些流行框架上受过训练的神经网络,优化神经网络计算,生成一个轻量级的运行时引擎,然后它将在这些GPU平台上最大限度地提高吞吐量、延迟和性能。2、工原创 2020-07-28 10:43:49 · 5524 阅读 · 2 评论 -
caffe源码阅读笔记(一) SoftmaxLayer
Softmax层的作用是将输入的预测向量转化为概率值,也就是每个元素介于0和1之间,其和为1。而Softmax loss是基于Softmax的输出,使用多元交叉熵损失函数得到的loss。下面我们来讨论一下他们其中的正向和反向导数推导,以及caffe中的源码实现。为了更好地将推导和代码相结合,以加深理解,本文将会在每个推导部分直接紧跟其代码实现。1. Softmax1.1 前向计算1.1.1 ...原创 2018-11-27 21:37:24 · 5374 阅读 · 0 评论 -
Crnn_chinese_characters 中文字符识别
Crnn_chinese_characters 中文字符识别重要的源码地址:Warp-ctcCrnn_chinese_characters_rec文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别一、实验环境没网、没权限、centos 64二、实验步骤1、离线安装 anacondaanaconda清华镜像源先下载anaconda3-4....原创 2019-01-15 19:21:31 · 13509 阅读 · 1 评论 -
Faster-RCNN系列(一) 制作自己的数据集Pascal_VOC格式
使用的是Faster-RCNN-TF一、数据集准备我们在做目标识别时,大家都知道要有训练集、验证集以及测试集,当然数据集格式也有很多种,我们这里使用的是pascal_voc数据格式。如下图是voc2007数据集文件夹格式JPEGImages:用来保存你的数据图片,当然,对于faster-rcnn来讲,所有的图片必须是jpg/jpeg格式,其他格式的话要转换一下。另外,一定要对图片进行编...原创 2019-02-18 13:20:56 · 7795 阅读 · 0 评论