- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 GPU架构中的半精度fp16与单精度fp32计算
GPU架构中的半精度与单精度计算 由于项目原因,我们需要对darknet中卷积层进行优化,然而对于像caffe或者darknet这类深度学习框架来说,都已经将卷积运算转换成了矩阵乘法,从而可以方便调用cublas 库函数和cudnn里tiling 过的矩阵乘。 CUDA在推出7.5的时候提出了 可以计算16位浮点数据的新特性。定义了两种新的数据类型half和half2. 之...
2018-04-17 15:51:26 26497
原创 openCV2.4.13 安装
openCV2.4.13 安装下载并解压unzip opencv-2.4.13.zip进入openCV目录,建立release文件夹cd opencv-2.4.13mkdir release安装依赖库sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-nu...
2018-04-14 15:09:22 2378 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人