目录 1.CPU2.GPU3.QA 1.CPU Shared LLC是L3缓存 2.GPU 上图有6个大核,每个绿点看作一个计算单元,一个绿点就可以开一个线程。 一般/高端 根据数千个线程来看,上千维的向量的利用率才更好 3.QA 有效的高质量的数据Alexnet比resnet模型要大,运算量要小。Alexnet最后的全连接层的参数量要大,因此模型要大,但resnet有更多的卷积层,层数也更深,虽然参数量小,但运算量其实挺大的。w-=lrw.grad没问题,w=w-lrw.grad有问题,后者会新建一个w变量,里边没有梯度了。