第八讲--深度学习软件--课时19

i_chase

于 2018-05-08 21:32:15 发布

阅读量122

点赞数

分类专栏： cs231n视觉识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39638957/article/details/80242743

版权

cs231n视觉识别专栏收录该内容

32 篇文章 2 订阅

订阅专栏

GPU最初就是为了游戏而开发的

深度学习GPU目前指的就是英伟达的GPU

--------------------------------------

CPU一般是八核，十六核...可以同时做许多不同的事。可以多线程

GPU一般是几千核，GPU的核很弱，很慢，需要几个协作才能处理任务

CPU只有很小的cache，没有内存

GPU本身有8/12/16GB的内存

------------------------------------------------------------------------------------------------------------------------------

GPU适合并行运算

矩阵相乘，卷积使用GPU非常高效（小的运算可能cpu更快，但是大运算gpu很有优势）

--------------------------------------------------------------------------------------------------------------------------------

CUDA是英伟达开发的类c语言，可以充分利用GPU特性

openCL 可以用于英伟达，AMD，CPU 但是较慢

-----------------------------------------------------------------

GPU一般比cpu快60-70倍

----------------------------------------------------------

使用英伟达的cuda库......，比你自己写的快两三倍。

-------------------------------------------------------------

模型存储在cpu或GPU上，但数据在计算机里，读取数据会相对变得很慢。推荐使用固态硬盘或者将数据读进RAM里

-----------------------------------------------------------------

numpy不能运行在gpu上！！！而且得手动计算梯度

--------------------------------------------------------------------------

tensorflow先声明计算图，再开始多次迭代

--------------------------------------------------------------------------

由于numpy只能在cpu上，而网络有时候在gpu上，传递起来非常慢，因此w需要声明为tf.Variable() 而不是tf.placeholder()

tf.placeholder是需要赋值为numpy变量的

---------------------------------------------------------------------------

只是sess.run(loss) 参数是不会更新的

需要

optimizer = tf.train.GradientDescentOptimizer(1e-3)

updates = optimizer.minimize(loss)

sess.run([loss,updates],feed_dict=values)

而updates事实上是通过tf.group(w1,w2...)来实现的，它不返回值，只是表明依赖关系,如下图

------------------------------------------------------------------------

tensorflow支持分布式计算，可以切换cpu/gpu

-----------------------------------------------------------------------------------

pytorch是动态计算图，tensorflow是静态计算图

-------------------------------------------------------------------------------

具体细节，代码太多，不贴了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第八讲--深度学习软件--课时19

GPU最初就是为了游戏而开发的深度学习GPU目前指的就是英伟达的GPU--------------------------------------CPU一般是八核，十六核...可以同时做许多不同的事。可以多线程GPU一般是几千核，GPU的核很弱，很慢，需要几个协作才能处理任务CPU只有很小的cache，没有内存GPU本身有8/12/16GB的内存--------------------------...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。