CUDA中加减以及转置运算(GPU)

近期需要使用cuda加速矩阵及图像的运算速度。
为了不再造轮子,在网上找了几天的cuda教程讲义什么的。高兴的是找到了矩阵X乘的运算(使用的是cuda自带的函数),研究如何使用也花了一下午的时间,不过总算研究出点儿端倪了。

但是突然发现网上没有现成的cuda矩阵加减以及转置的运算(可能还是花费的时间精力不够多,始终没有找到,要是有朋友知道,无论是留言还是私信 请一定告知本人,先行谢过!)。既然找不到现成的轮子,就决定自己做个轮子。因为是短时间速编的程序,思路上没毛病,bug方面目前还没有发现,自己用着也不予乐乎(如果有大神看到我的代码,发现不合时宜的地方,请指出并告知优化方法!谢谢!)。

因为CUDA自带的矩阵X乘函数cublasSgemm 使用起来特别晕,所以本人也稍稍的把它封装到我的函数里面了(借鉴了网上大神的方法),最终用起来简单、易懂、还好使。

本人的代码其实大体上只能定义为一种思路,只是根据自己的需求写的。

希望用过的人都说好!


下面是代码传送门:

代码传送门

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值