关于用CUDA优化三层反传神经网络算法

把bp算法改写成了CUDA代码,用卡内基梅隆大学的人脸识别图片套尝试了一下人脸识别,对比cpu的速度其实是下降了一倍左右。

原因是这个图像处理只需要用到3个隐藏神经元,缺需要12000个输入神经元。数据copy和运算量的对比才刚达到1比3,根本没用上cuda的优势。

把隐藏神经元数量增加到30个之后,优势就非常明显地体现出来了。cpu算法消耗的时间成倍上涨,而cuda基本不怎么涨。但是也是存在问题的,当隐藏神经元数量进一步上涨之后,cpu算法也就是更慢而已,但是cuda则直接驱动程序失去响应导致程序退出屏幕黑屏了,鲁棒性非常差。

总体来说cuda在神经网络算法上较难体现巨大优势,下次还是用openmp来试试。不过这种多线程编程实在是太累人,一个非常简单短小的cpu程序要经过好几个步骤才能搞成多线程程序,最后收益却并不是特别明显。下次隐藏神经元多的时候再体验一下。

转载于:https://www.cnblogs.com/hyperddr/archive/2011/10/23/2221864.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值