11、Caffe -CUDA

最新推荐文章于 2022-07-10 13:10:10 发布

wtj318_

最新推荐文章于 2022-07-10 13:10:10 发布

阅读量1.4k

点赞数

分类专栏： caffe

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wtj318_/article/details/82852010

版权

caffe 专栏收录该内容

21 篇文章 1 订阅

订阅专栏

一、GPU下使用Caffe

源码中.cu后缀结尾的文件都是GPU下运行的文件代码。
依赖库：cuDNN (CUDA下的DNN库)
安装Caffe前先安装好CUDA驱动和cnDNN库。

下载地址：https://developer.nvidia.com/cuda-80-ga2-download-archive

将Cuda放到ubuntu主界面

终端下CUDA安装：

$ sudo sh cuda_8.0.61_375.26_linux.run

#等一段时间

#更多0%时不断enter到100%

#选择如下，之后等待：

#补丁安装

$ sudo sh cuda_8.0.61.2_linux.run

#如上操作

#更新完成后，仍缺少一些依赖库

#安装缺少的库

$ sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

#后两个依赖库没安装上

二、GPU下做深度学习的硬件知识

NVIDIA的优势：

a、有CUDA这一标准库。

b、N卡的GPU计算和GPGPU社区很大。

c、NVIDIA公司押注深度学习

2. 是否需要多个GPU？

在多个GPU上，神经网络难以进行有效的并行化。

3.为什么GPU比CPU更适合做深度学习？

如上图：GPU是多窗口同步滑动。

4. NVIDIA的GPU的类型：

a、面向3D游戏应用的GeForce系列：GTX1080、Titan X和GTX980.

b、面向图形工作站应用的Quadro系列，主要针对CAD、3DMaxs、Maya.

c、专业GPU加速计算的Tesla系列； Kepler系列：K40/K80； Maxwell 系列：M4/M40/M60； Pascal:P100;

三、卷积神经网络的基本内存需求

1、激活和误差

占用主要内存，但确定某状态的激活和误差的尺寸大小很难，主要内存需求来自输入数据大小。

2、输入维度

维度：224*224*3，即224*224像素的3色通道图像。 ImageNet上至少需要12GB。

维度：112*112*3，,内存：4-6 GB

视频数据：25*75*75*3，12GB达不到效果。

3、训练样本规模

只取ImageNet的10%样本训练，模型拟合速度快，图像越少内存越少。

4、标签数量

a、2类模型相对于1000类，内存消耗更少。但是，区分越少，越容易过拟合。

b、训练数据量不够大时，多GPU训练出的模型容易过拟合。

四、减少内存占用技术

1、更大的stride

卷积核使用更大的stride，达到减少输出数据目的。

2、使用1*1卷积核

96个1*1卷积核可使得64*64*256的输入数据降为64*64*96。

3、池化

2*2的池化层将减少4层数据量，从而大大减少后续层内存占用。

4、减少mini-batch大小

size为64个样本的mini-batch比128个样本的batch减少一半的内存消耗。缺点是时间代价大，低至32个样本作为最后策略。

5、改变数据类型

将数据类型由32位换为16位，可以减半内存不降低性能。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
11、Caffe -CUDA

一、GPU下使用Caffe源码中.cu后缀结尾的文件都是GPU下运行的文件代码。依赖库：cuDNN (CUDA下的DNN库) 安装Caffe前先安装好CUDA驱动和cnDNN库。下载地址：https://developer.nvidia.com/cuda-80-ga2-download-archive将Cuda放到ubuntu主界面终端下CUDA安装：$ sudo ...
复制链接

扫一扫

专栏目录

wtj318_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

63: 原创

8万+: 周排名

89万+: 总排名

9万+: 访问

: 等级

1395: 积分

22: 粉丝

37: 获赞

21: 评论

189: 收藏

私信

关注

热门文章

分类专栏

数据集处理 3篇
目标检测 1篇
pytorch 5篇
深度学习
爬虫
ros 13篇
pcl 5篇
caffe 21篇
ubuntu 2篇
文 2篇
ubuntu系统安装环境配置 4篇
tensorflow 3篇
问题 3篇

最新评论

把xml数据集转为 BDD100K 的json数据格式
alimony: 请问如果要删掉某个类别，是不是 “ if category == "删掉的类别": continue”
一、Ubuntu18.04——安装opencv3.4.16
wtj318_: using namespace cv；
一、Ubuntu18.04——安装opencv3.4.16
qq_23947117: 楼主，按照这个方法安装之后，运行test程序，报错[code=csharp] opencv_test.cpp:7:5: error: ‘VideoCapture’ was not declared in this scope VideoCapture cap(0);//打开摄像头 ^~~~~~~~~~~~ opencv_test.cpp:10:9: error: ‘cap’ was not declared in this scope if(!cap.isOpened()) ^~~ opencv_test.cpp:10:9: note: suggested alternative: ‘bcmp’ if(!cap.isOpened()) ^~~ bcmp opencv_test.cpp:15:9: error: ‘cap’ was not declared in this scope cap>>frame; ^~~ opencv_test.cpp:15:9: note: suggested alternative: ‘bcmp’ cap>>frame; ^~~ bcmp opencv_test.cpp:20:9: error: ‘imshow’ was not declared in this scope imshow("video",edges); ^~~~~~ opencv_test.cpp:21:12: error: ‘waitKey’ was not declared in this scope if(waitKey(20)>0) ^~~~~~~ opencv_test.cpp:24:5: error: ‘cap’ was not declared in this scope cap.release(); ^~~ opencv_test.cpp:24:5: note: suggested alternative: ‘bcmp’ cap.release(); [/code]
bag 包文件转化成pcd
wtj318_: 没做过，为啥要进行多帧保存呀，不会有位置偏移吗
bag 包文件转化成pcd
Tammy1111111: 请问可以以多帧为单位保存吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。