- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 half和float两种数据类型之间的转换
half和float两种数据类型之间的转换Half是用16位表示浮点数的一种数据类型,在IEEE 754中也有规定,这种数据类型在深度学习系统中的应用比较广泛。但是在当前主流cpu上,不支持half类型数据的计算和输出,所以需要half和float两个数据类型之间的转换。 图1是16位浮点表示的标准,其中包括了1个符号位,5个指数位和10个尾数位。对于正常的数值,其结果如下表示。 val=...
2018-03-09 10:47:54 15871 1
原创 OpenCL面向存储结构优化的研究
OpenCL是一种面向多设备、多平台的编程语言,被多个设备生产厂家支持,具有良好的兼容性。但是,由于不同设备之间有很大的差异,在不同设备上针对OpenCL的调优手段也大不相同。这里主要针对两款GPU,分别是ARM公司的Mali-T860(以下简称为T860)和NVIDIA公司的GeForce GTX 950M(以下简称为950M),使用不同的内存优化策略,评估1024*1024规模的矩阵相乘的性能...
2018-03-03 20:53:03 1455
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人