2017年08月_csshuke

12月 11月 10月 09月 08月 07月 06月 04月 03月 02月 01月

转载 Machine Learning Yearning book draft - 读记（前14章）

本篇文章由作者授权转载，转自知乎.首先，非常感谢Andrew NG对于本书《Machine Learning Yearning》的贡献，本书总共大概50多章，昨天收到了1-12章（1-2页/章，总共23页）的手稿，让各位读者一睹为快。附上书的下载地址：1-12章https://gallery.mailchimp.com

2017-08-22 16:38:35 821

转载 numpy中的matrix矩阵处理

今天看文档发现numpy并不推荐使用matrix类型。主要是因为array才是numpy的标准类型，并且基本上各种函数都有队array类型的处理，而matrix只是一部分支持而已。这个转载还是先放着了，少用，少用！ from http://www.cnblogs.com/sumuncle/p/5760458.htmlnumpy模块中的矩阵对象为numpy.matri

2017-08-04 05:01:35 602

转载 numpy性能优化

2017-08-04 05:00:55 1209

转载 numpy使用MKL库提升计算性能

系统：Gentoo Linux (64bit, Kernel 3.7.1)配置：Intel(R) Core(TM) i7-2670QM在Gentoo中安装Numpy/Scipy非常简单，直接emerge就可以解决。但是默认链接的blas/lapack库性能非常差，在矩阵计算方面比MATLAB慢了不少。原因在于MATLAB使用的是高度优化的数值计算库Intel math kernel lib

2017-08-04 04:58:01 4235

转载 GPU与CPU版本的矩阵乘法对比

由于刚刚开始学习Cuda，还没有整理出一个完整的Cuda类，只是在Nvidia提供的kenerl架构上做修改。　　但用于初体验GPU给我们带来的好处也绰绰有余了。　　直接贴代码：/* 矩阵乘法，CPU版本和GPU版本的对比*/#include "cuda_runtime.h"#include "device_launch_parameters.h"#inc

2017-08-04 04:55:26 1470

转载详解CUDA核函数及运行时参数

2017-08-04 03:06:45 709

原创 C++、python、CUDA性能分析--矩阵乘法

前言矩阵乘法非常适合在GPU上并行运行，但是使用GPU并行后能获得多大的性能提升？本文将通过一些实验分析CUDA程序的性能。测试环境本文使用Dell XPS 8700作为测试机，相关配置如下：型号Dell XPS 8700CPUIntel Core i7-4970 3.6GHz主存16GBGPUGeForce GTX

2017-08-01 03:41:24 2652

原创一个程序来比较cuda/c在GPU/CPU的运行效率

在网上看了一个比较GPU和CPU执行矩阵运算效率的帖子，亲自跑了一下。这是一个CUDA语言程序，请保存为“文件名.cu”。我的主机配置如下：CPU:G2030；内存8GB；显卡：GTX750ti。代码如下所示：#include "cuda_runtime.h"#include "device_launch_parameters.h"#include #include

2017-08-01 02:54:00 7138 3

FPGA入门教程

非常详细的FPGA入门教程，很适合初学者。

2013-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人