深度学习中遇到的一些tricks

最新推荐文章于 2022-12-26 20:09:55 发布

下大禹了

最新推荐文章于 2022-12-26 20:09:55 发布

阅读量178

点赞数

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_43541325/article/details/107779511

版权

深度学习专栏收录该内容

17 篇文章 2 订阅

订阅专栏

1. 在推理时使用torch.backends.cudnn.benchmark = true，可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

一般来讲，应该遵循以下准则：

①. 如果网络的输入数据维度或类型上变化不大，设置 torch.backends.cudnn.benchmark = true 可以增加运行效率；

②. 如果网络的输入数据在每次 iteration 都变化的话，会导致 cnDNN 每次都会去寻找一遍最优配置，这样反而会降低运行效率。

所以，推理视频流时，应保证每个摄像头传递给算法的图片一样大小。

2. Linux下，使用pytorch有时候会出现占用过多CPU资源的问题（占用过多线程），解决方法如下：

①. torch.set_num_threads(int thread) （亲测比较有效）

②. export OMP_NUM_THREADS = 1 （未测）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

下大禹了

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

深度学习系列资料总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

07-17

2万+

说明本系列深度学习资料集合包含机器学习、深度学习等各系列教程，主要以计算机视觉资料为主，包括图像识别、分类、检测、分割等，内容参考Github及网络资源，仅供个人学习。深度学习定义一般是指通过训练多层网络结构对未知数据进行分类或回归深度学习分类有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等；无监督学习方法——深度信念网、深度玻尔兹曼机，深度自编码器等。手写机器学习笔记github机器学习算法公式推导以及numpy实现github人工智能相关术语link。..................

window配置cpu深度学习环境 keras+tensorflow+torch 版本搭配详细教程 pip 下载sklearn

11-14

3853

python配置cpu深度学习环境 keras+tensorflow+torch+bert_wwm_ext_pytorch 版本搭配

参与评论您还未登录，请先登录后发表或查看评论

深度学习的发展与挑战

weixin_43717123的博客

02-09

1579

本文介绍深度神经网络在不同的分类问题和接近人类水平性能的应用领域上的显著成果。讨论深度学习作为未来科学的各种疑问，揭示深度神经网络在机器执行任务方面的隐藏能力。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计，将会带来全新的写作体验；在创作中心设置你喜爱的代码高亮样式，M...

模型部署之NVIDIA AGX Xavier 配置和使用Torch，ONNX，TensorRT做模型推理

Cameron_Rin的博客

12-26

3722

Nvidia AGX Xavier 配置CUDA，PyTorch，ONNX，TensorRT，将深度学习模型部署到小车上，测试三个计算框架的性能

torch.backends.cudnn.benchmark的用法

木盏

12-01

9424

首先，要明白backends是什么，Pytorch的backends是其调用的底层库。torch的backends都有： cuda cudnn mkl mkldnn openmp 代码torch.backends.cudnn.benchmark主要针对Pytorch的cudnn底层库进行设置，输入为布尔值True或者False：设置为True，会使得cuDNN来衡量自己库里面的多个卷积算法的速度，然后选择其中最快的那个卷积算法。我们看官方文档描述：所以，当这个参数设置为True时，启动算法的前

cudnn.benchmark = True

晓野豬

10-08

3069

代码： cudnn.benchmark = True 代码释意：通过如上设置让内置的cuDNN的auto-tuner自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。遵循准则：网络的输入数据维度或类型上变化不大，设置为true可以增加运行效率；如果网络的输入数据在每个iteration都变化的话，会导致cnDNN每次都会去寻找一遍最优配置，这样反而会降低运行效率; Note: cuDNN是英伟达专门为深度神经网络所开发出来的GPU加速库，针对卷积、池化等等常见操作做了非常多的底

这十大挑战，摆在DL面前：马库斯长文质疑深度学习

量子位

01-03

1051

夏乙若朴安妮编译整理量子位出品 | 公众号 QbitAI多年坚持为深度学习泼冷水的纽约大学心理学教授马库斯老师（Gary Marcus），今天终于写了一篇长长的文章，将自己的对深度学习的看法全面、系统地阐述了一遍。在他长达27页（含参考文献）的文章“深度学习的批判性评价”中，马库斯回顾了深度学习这5年来的复兴历程，更重要的是，指出了深度学习目前面临的十大挑战。这篇论文Deep Learni

39. 深度学习中的各种tricks_1.0_label_smoothing - 兔角与禅 - CSDN博客1

08-03

深度学习中的各种[ 用于整理遇到的NN设计中使用的不同结构和trick的原理与实现 ]label smoothing （标签平滑）在读cleverhans的示例

深度卷积神经网络（CNN tricks）调参技巧（一）学习率调节

踏雪飞鸿的博客

12-22

2万+

做卷积神经网路方面的研究，有时会遇到一些苦恼。大抵是： 1、复现别人的网络，得不到相同的表现。 2、自己的网络调参，结果调不上去。所以有些大佬就总结了一些调参的tricks,在这里学习记录一下，然后加上一些自己的理解。影像神经网络效果的因素可能有但不限于以下几点：学习率调节优化器初始化方法标签平滑归一化学习率好的学习率可以让调参过程事半功倍，那么什么是好的学习率呢， sou...

机器学习系列(10)_如何提高深度学习(和机器学习)的性能

热门推荐

寒小阳

09-24

3万+

我经常被问到诸如`如何从深度学习模型中得到更好的效果`的问题，类似的问题还有：我如何提升准确度,如果我的神经网络模型性能不佳，我能够做什么？对于这些问题，我经常这样回答，“我并不知道确切的答案，但是我有很多思路”，接着我会列出了我所能想到的所有**或许能够给性能带来提升**的思路，。为避免一次次罗列出这样一个简单的列表，我决定把所有想法详细写在这篇博客里。这些思路应该是通用的

benchmark问题_CPU深度学习模型推理性能抖动问题

weixin_42548782的博客

01-02

656

问题客户在其环境中发现推理延时毛刺问题，如下：模型为ResNet-152 v1 FP32推理。从log可见，抖动出现的频率还比较高，且双路时抖动时延高达平均时延的20倍左右，已经会影响客户的SLA(Service Level Agreement)。初步排查环境是裸机还是云主机?裸机绑核了吗？使用下面的命令：$ export OMP_NUM_THREADS= 52$ export MKL_NUM_T...

python include expected 2got1_Pytorch在训练过程中常见的问题

weixin_39643244的博客

12-18

1105

不断更新1 Input type (CUDAFloatTensor) and weight type (CPUFloatTensor) should be the same仔细看错误信息，CUDA和CPU，输入数据x和模型中的权重值类型不一样，一般来说是因为模型的参数不在GPU中，而输入数据在GPU中，通过添加model.cuda()将模型转移到GPU上以解决这个问题。2 Input type (...

深度学习之常见tricks

Leo的博客

01-07

4303

本文主要给出了在实现网络或者调节代码过程使用的以及平时看一些文章记录下来的一些小技巧，主要针对卷积网络和图像处理。就个人感受，有些技巧还是非常有效的，而且通常可以通过看开源库的一些文档或者源代码来发掘这些内容，最后能够称为自己所用。 1.构造validation set 一般数据集可能不会给出验证集，所以自己会从给的训练集中按照一定比例（9：1）分离出验证集。 2.增加训练数据为了更好的

【深度学习】深度学习模型训练的tricks总结

无极阁

04-30

5523

得到更改的准确率模型的设计自然是重要，而使用一些数据处理和训练的技巧也能提高最终模型的训练效果，因此也十分重要。本文基于对一些资料的阅读总结一些模型训练常见的trick，能够更快地拟合以及在一定程度上提升模型效果。

安装torch2trt 和TensorRT 踩坑记录

下大禹了的博客

05-08

1万+

以前一直以为pytorch模型转tensorrt的话，需要先转onnx才行，突然发现还有torch2trt这个东东，可以直接转torch模型为tensorrt。安装torch2trt torch2trt下载地址：https://github.com/NVIDIA-AI-IOT/torch2trt readme上有安装说明，按他说的干就是，安装中出了一个问题，在执行sudo python setu...

深度学习3：归一化和去均值化

下大禹了的博客

12-22

5212

归一化进行归一化的原因是把各个特征的尺度控制在相同的范围内，这样可以便于找到最优解，不进行归一化时如左图，进行归一化后如右图，可发现能提高收敛效率，省事多了。　　　　　　　　　　　　　一种是最值归一化，比如把最大值归一化成1，最小值归一化成-1；或把最大值归一化成1，最小值归一化成0。适用于本来就分布在有限范围内的数据。另一种是均值方差归一化，一般是把均值归一化成0，方差归一化成1。适用于...

yolov3，yolov3-spp转onnx再转tensorrt填坑记录

下大禹了的博客

06-05

4584

1.官方代码使用python2转的onnx，比如这份代码：https://github.com/Cw-zero/TensorRT_yolo3_module 这里有份使用python3转onnx的代码：https://github.com/jkjung-avt/tensorrt_demos 2.报错ERROR: ValueError: not enough values to unpack (expected 2, got 1) yolov3.cfg文件使用官方提供的，有两点需注意：一.两层之间至少有1条空线

百度飞桨AIStudio平台持久化安装环境

下大禹了的博客

10-04

3749

每次在AIStudio上重启项目都要在再安装一次环境，这是因为默认的安装位置在重启后还原了，只需在项目下新建个文件夹存放安装环境即可。 # 如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例: # If a persistence installation is required, you need to use the persistence path as the following: !mkdir /home/aistudio/external-libraries !pip install

深度学习tricks