2018年10月_Tiger-Li

转载粒子群算法1——常用智能算法

一、遗传算法1.概念遗传算法(GA)自 1975 年 Holland 提出之后，作为一种经典的进化算法，已经在国际上形成了一个活跃的研究领域。经典遗传算法首先对待求解问题的参数进行编码，编码的每一位称之为“基因”，由基因组成的若干矢量称之为“染色体”。这样将所求问题的每一组参数解编码为一个染色体，若干染色体按照自然界优胜劣汰的进化规律，以适应度函数为评价解好坏的标准，逐代演化...

2018-10-17 08:33:24 1200

转载 CUDA并行存储模型

CUDA将CPU作为主机（Host），GPU作为设备（Device）。一个系统中可以有一个主机和多个设备。CPU负责逻辑性强的事务处理和串行计算，GPU专注于执行高度线程化的并行处理任务。它们拥有相互独立的存储器（主机端的内存和显卡端的显存）。运行在GPU上的函数称为kernel（内核函数）。一个完整的CUDA程序是由一些列的kernel函数和主机端的串行处理步骤共同完成的。CPU串行...

2018-10-10 15:34:03 272

转载 CUDA编程（七）共享内存与Thread的同步

https://blog.csdn.net/sunmc1204953974/article/details/51078818 CUDA编程（七）共享内存与Thread的同步在之前我们通过block，继续增大了线程的数量，结果还是比较令人满意的，但是也产生了一个新的问题，即，我们在CPU端的加和压力变得很大，所以我们想到能不能从GPU上直接完成这个工作。我们知道每个block内部...

2018-10-10 14:15:38 472

转载 CUDA 共享内存 bank conflict

1. bank conflict本文所有的实验针对 GTX980 显卡，Maxwell 架构，计算能力 5.2。GPU 共享内存是基于存储体切换的架构（bank-switched-architecture）。在 Femi，Kepler，Maxwell 架构的设备上有 32 个存储体（也就是常说的共享内存分成 32 个bank），而在 G200 与 G80 的硬件上只有 16 个存储体。...

2018-10-09 15:05:03 1377

转载 CUDA GPU编程如何避免Bank conflict

CUDA GPU编程如何避免Bank conflict 强烈推荐参考书：Professional CUDA C Programming，本书第234页开始对bank conflict有非常详尽的讲解，本文正是从本书的学习和自己的编程经验中总结而来。 1 为什么要避免Bank conflict Shared memory在芯片SM（Streaming Mu...

2018-10-09 15:02:58 1695

从硬件角度分析，支持CUDA的NVIDIA 显卡，都是由多个multiprocessors 组成。每个 multiprocessor 里包含了8个stream processors，其组成是四个四个一组，也就是两组4D的处理器。每个 multiprocessor 还具有很多个（比如8192个）寄存器，一定的（比如16KB） share memory，以及 texture cache 和 cons...

2018-10-09 11:42:10 741

转载 CUDA 共享内存 bank conflict

1. bank conflict本文所有的实验针对 GTX980 显卡，Maxwell 架构，计算能力 5.2。GPU 共享内存是基于存储体切换的架构（bank-switched-architecture）。在 Femi，Kepler，Maxwell 架构的设备上有 32 个存储体（也就是常说的共享内存分成 32 个bank），而在 G200 与 G80 的硬件上只有 16 个存储体。...

2018-10-09 11:36:33 737

转载 CUDA 显卡 GPU memory

http://www.cnblogs.com/traceorigin/archive/2013/04/11/3015482.html CUDA存储器类型：每个线程拥有自己的register and loacal memory;每个线程块拥有一块shared memory;所有线程都可以访问global memory;还有，可以被所有线程访问的只读存储器：constant m...

2018-10-08 16:19:31 2675

kebu12345678的博客

转载粒子群算法1——常用智能算法

转载 CUDA并行存储模型

转载 CUDA编程（七）共享内存与Thread的同步

转载 CUDA 共享内存 bank conflict

转载 CUDA GPU编程如何避免Bank conflict

转载 CUDA之Thread、Wrap执行详解

转载 CUDA 共享内存 bank conflict

转载 CUDA 显卡 GPU memory

Xilinx FPGA XDC约束技巧

Optimizing parallel reduction in CUDA 规约优化文档

空空如也