自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (2)
  • 收藏
  • 关注

转载 粒子群算法1——常用智能算法

一、遗传算法1.概念       遗传算法(GA)自 1975 年 Holland 提出之后,作为一种经典的进化算法,已经在国际上形成了一个活跃的研究领域。经典遗传算法首先对待求解问题的参数进行编码,编码的每一位称之为“基因”,由基因组成的若干矢量称之为“染色体”。这样将所求问题的每一组参数解编码为一个染色体,若干染色体按照自然界优胜劣汰的进化规律,以适应度函数为评价解好坏的标准,逐代演化...

2018-10-17 08:33:24 1200

转载 CUDA并行存储模型

CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。CPU负责逻辑性强的事务处理和串行计算,GPU专注于执行高度线程化的并行处理任务。它们拥有相互独立的存储器(主机端的内存和显卡端的显存)。  运行在GPU上的函数称为kernel(内核函数)。一个完整的CUDA程序是由一些列的kernel函数和主机端的串行处理步骤共同完成的。CPU串行...

2018-10-10 15:34:03 272

转载 CUDA编程(七)共享内存与Thread的同步

https://blog.csdn.net/sunmc1204953974/article/details/51078818 CUDA编程(七)共享内存与Thread的同步在之前我们通过block,继续增大了线程的数量,结果还是比较令人满意的,但是也产生了一个新的问题,即,我们在CPU端的加和压力变得很大,所以我们想到能不能从GPU上直接完成这个工作。我们知道每个block内部...

2018-10-10 14:15:38 472

转载 CUDA 共享内存 bank conflict

1. bank conflict本文所有的实验针对 GTX980 显卡,Maxwell 架构,计算能力 5.2。GPU 共享内存是基于存储体切换的架构(bank-switched-architecture)。在 Femi,Kepler,Maxwell 架构的设备上有 32 个存储体(也就是常说的共享内存分成 32 个bank),而在 G200 与 G80 的硬件上只有 16 个存储体。...

2018-10-09 15:05:03 1377

转载 CUDA GPU编程如何避免Bank conflict

 CUDA GPU编程如何避免Bank conflict  强烈推荐参考书:Professional CUDA C Programming,本书第234页开始对bank conflict有非常详尽的讲解,本文正是从本书的学习和自己的编程经验中总结而来。 1 为什么要避免Bank conflict         Shared memory在芯片SM(Streaming Mu...

2018-10-09 15:02:58 1695

转载 CUDA之Thread、Wrap执行详解

从硬件角度分析,支持CUDA的NVIDIA 显卡,都是由多个multiprocessors 组成。每个 multiprocessor 里包含了8个stream processors,其组成是四个四个一组,也就是两组4D的处理器。每个 multiprocessor 还具有 很多个(比如8192个)寄存器,一定的(比如16KB) share memory,以及 texture cache 和 cons...

2018-10-09 11:42:10 741

转载 CUDA 共享内存 bank conflict

1. bank conflict本文所有的实验针对 GTX980 显卡,Maxwell 架构,计算能力 5.2。GPU 共享内存是基于存储体切换的架构(bank-switched-architecture)。在 Femi,Kepler,Maxwell 架构的设备上有 32 个存储体(也就是常说的共享内存分成 32 个bank),而在 G200 与 G80 的硬件上只有 16 个存储体。...

2018-10-09 11:36:33 737

转载 CUDA 显卡 GPU memory

http://www.cnblogs.com/traceorigin/archive/2013/04/11/3015482.html CUDA存储器类型:每个线程拥有自己的register and loacal memory;每个线程块拥有一块shared memory;所有线程都可以访问global memory;还有,可以被所有线程访问的只读存储器:constant m...

2018-10-08 16:19:31 2675

Xilinx FPGA XDC约束技巧

Xilinx FPGA XDC约束技巧

2017-12-25

Optimizing parallel reduction in CUDA 规约优化文档

Optimizing parallel reduction in CUDA 规约优化文档

2017-12-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除