- 博客(8)
- 资源 (3)
- 收藏
- 关注
转载 Machine Learning Yearning book draft - 读记(前14章)
本篇文章由作者授权转载,转自知乎.首先,非常感谢Andrew NG对于本书《Machine Learning Yearning》的贡献,本书总共大概50多章,昨天收到了1-12章(1-2页/章,总共23页)的手稿,让各位读者一睹为快。附上书的下载地址:1-12章https://gallery.mailchimp.com
2017-08-22 16:38:35 821
转载 numpy中的matrix矩阵处理
今天看文档发现numpy并不推荐使用matrix类型。主要是因为array才是numpy的标准类型,并且基本上各种函数都有队array类型的处理,而matrix只是一部分支持而已。这个转载还是先放着了,少用,少用! from http://www.cnblogs.com/sumuncle/p/5760458.htmlnumpy模块中的矩阵对象为numpy.matri
2017-08-04 05:01:35 602
转载 numpy性能优化
版权声明:本文为博主皮皮http://blog.csdn.net/pipisorry原创文章,未经博主允许不得转载。目录(?)[+]http://blog.csdn.net/pipisorry/article/details/39087583IntroductionNumPy提供了一个特殊的数据类型ndarray,其在向量计算
2017-08-04 05:00:55 1209
转载 numpy使用MKL库提升计算性能
系统:Gentoo Linux (64bit, Kernel 3.7.1)配置:Intel(R) Core(TM) i7-2670QM在Gentoo中安装Numpy/Scipy非常简单,直接emerge就可以解决。但是默认链接的blas/lapack库性能非常差,在矩阵计算方面比MATLAB慢了不少。原因在于MATLAB使用的是高度优化的数值计算库Intel math kernel lib
2017-08-04 04:58:01 4235
转载 GPU与CPU版本的矩阵乘法对比
由于刚刚开始学习Cuda,还没有整理出一个完整的Cuda类,只是在Nvidia提供的kenerl架构上做修改。 但用于初体验GPU给我们带来的好处也绰绰有余了。 直接贴代码:/* 矩阵乘法,CPU版本和GPU版本的对比*/#include "cuda_runtime.h"#include "device_launch_parameters.h"#inc
2017-08-04 04:55:26 1470
转载 详解CUDA核函数及运行时参数
版权声明:本文为博主原创文章,未经博主允许不得转载。核函数是GPU每个thread上运行的程序。必须通过__gloabl__函数类型限定符定义。形式如下: __global__ void kernel(param list){ }核函数只能在主机端调用,调用时必须申明执行参数。调用形式如下:
2017-08-04 03:06:45 709
原创 C++、python、CUDA性能分析--矩阵乘法
前言矩阵乘法非常适合在GPU上并行运行,但是使用GPU并行后能获得多大的性能提升?本文将通过一些实验分析CUDA程序的性能。测试环境本文使用Dell XPS 8700作为测试机,相关配置如下:型号Dell XPS 8700CPUIntel Core i7-4970 3.6GHz主存16GBGPUGeForce GTX
2017-08-01 03:41:24 2652
原创 一个程序来比较cuda/c在GPU/CPU的运行效率
在网上看了一个比较GPU和CPU执行矩阵运算效率的帖子,亲自跑了一下。这是一个CUDA语言程序,请保存为“文件名.cu”。我的主机配置如下:CPU:G2030;内存8GB;显卡:GTX750ti。代码如下所示:#include "cuda_runtime.h"#include "device_launch_parameters.h"#include #include
2017-08-01 02:54:00 7138 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人