取模 乘法和除法运算在CPU和GPU上的效率

本文通过实验比较了在CPU(Core2 Q6600)和GPU(GTX280)上,三种算法(取模、整数除法、乘以浮点数逆元)在整数分解任务中的效率。实验结果显示,在CPU上,取模运算效率接近整数除法;而在GPU上,浮点运算最快,取模次之,整数除法最慢。因此,针对不同硬件平台,选择合适的运算方式可以提高性能。
摘要由CSDN通过智能技术生成

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

               

问题:

    将整数n分解为i和j,满足下面关系:

n  =  j * idim + i

    其中idim为常量。

    以下为三种算法实现:
    1) i = n % idim,j = (n - i) / idim

    2) j = n * ridim,i = n - j * idim,其中ridim = 1.0f / idim,为浮点数。

    3) i = n % idim,j = (n - i) * ridim,其中ridim = 1.0f / idim,为浮点数。

 

CPU上的实现代码如下:

// 算法1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值