自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

This is Chuanqiz's Blog

记录与分享

08月 07月 04月 03月 01月

原创 GPU架构中的半精度fp16与单精度fp32计算

GPU架构中的半精度与单精度计算由于项目原因，我们需要对darknet中卷积层进行优化，然而对于像caffe或者darknet这类深度学习框架来说，都已经将卷积运算转换成了矩阵乘法，从而可以方便调用cublas 库函数和cudnn里tiling 过的矩阵乘。 CUDA在推出7.5的时候提出了可以计算16位浮点数据的新特性。定义了两种新的数据类型half和half2. 之...

2018-04-17 15:51:26 26497

原创 openCV2.4.13 安装

openCV2.4.13 安装下载并解压unzip opencv-2.4.13.zip进入openCV目录,建立release文件夹cd opencv-2.4.13mkdir release安装依赖库sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-nu...

2018-04-14 15:09:22 2378 2

并行程序设计

并行程序设计PPT，与并行程序设计配套使用.

2015-11-06

opencv中文版

图像处理，专业用于图像处理，视频检测，摄像头应用等

2013-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

__DARK__ CSDN认证博客专家 CSDN认证企业博客

码龄12年

IP 属地：浙江省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

111: 原创

10万+: 周排名

101万+: 总排名

40万+: 访问

: 等级

4798: 积分

70: 粉丝

111: 获赞

56: 评论

345: 收藏

私信

关注

热门文章

分类专栏

最新评论

GPGPU-SIM 之编译错误 cannot find -lcutil_x86_64 -lshrutil_x86_64
Wang121201: 可以去NVIDIA_GPU_Computing_SDK所在的目录重新编译一下
Jetson TK1 刷机步骤小记
weixin_53262184: 咋个办呀
Jetson TK1 刷机步骤小记
weixin_53262184: 他报错，failed flashing ardbeg
cache 写回策略
Shang-fei: 3.为什么写回法搭配写分配法？ - 若搭配非写分配法，写未命中时会直接修改主存中的内容，若一直有新的写入会一直修改主存。若搭配写分配法，写未命中会调入cache并修改，之后的新的写会直接修改cache，直到被替换后再写入主存中。相比较而言选择写分配法。 4.为什么全写法搭配非写分配法？ - 若搭配写分配法，写未命中会调入cache并修改，之后的新的写入会同时修改cache和主存。若搭配非写分配法，写未命中时会直接修改主存中的内容，若一直有新的写入会一直修改主存。相比较而言选择非写分配法。
cache 写回策略
若风吹彼岸: 一次性写回策略有脏位吗？

最新文章

提示

确定要删除当前文章？

取消删除