博客专栏  >  移动开发   >  CUDA learning

CUDA learning

基于GPU通用计算的目标,学习CUDA编程,深入理解GPU架构,了解底层汇编

关注
3 已关注
23篇博文
  • Jetson TX2 之 JetPack 3.0 安装小记

    前言本文主要参考YouTube视频,《JetPack 3.0 - NVIDIA Jetson TX2》 视频链接如下: https://www.youtube.com/watch?v=D...

    2017-06-25 21:23
    3397
  • PTX ISA 之 Control Flow Instructions

    Control Flow InstructionsThe following PTX instructions and syntax are for controlling execution in ...

    2017-06-29 11:11
    112
  • Jetson TX1/TX2 deviceQuery

    nvidia@tegra-ubuntu:/usr/local/cuda/samples/1_Utilities/deviceQuery$ ./deviceQuery ./deviceQuery St...

    2017-07-07 16:54
    348
  • GPGPU-Sim ispass2009 编译问题0

    GPGPU-Sim ispass2009 编译问题0最早接触GPU-SIM时的几个问题.thanks the reply for wdwQuestion AES在编译AES的时候,一直出现这个错误“f...

    2017-08-09 09:30
    126
  • PTX ISA Special Registers

    PTX ISA Special Registers综述PTX includes a number of predefined, read-only variables, which are visib...

    2017-08-11 14:21
    166
  • 零拷贝问题

    Zero copy in TK1and TX1 and TX2tx1 架构图说明 JETSON TK1,TX1,TX2都是CPU-GPU异构架构,共享主存DRAM(最下边的) 左上角,双核arm A5...

    2017-08-12 17:44
    288
  • CUDA 编程 之 cuda occupancy

    Occupancy = Active Warps / Maximum Active Warps Remember: resources are allocated for the entire blo...

    2016-12-28 23:19
    247
  • CUDA Program Analysis

    Nvidia Visio profilernvprof ./app input file simple compile process.cu -> .ptx -...

    2016-12-29 09:05
    236
  • CUDA 编程 之 CUDA-MEMCHECK 工具 简介

    CUDA-MEMCHECK1.IntroductionCUDA-MEMCHECK是一个在CUDA toolkit 中的功能性的正确性检查组件。**这个**suite有4个工具 :memcheckThe...

    2016-12-29 21:01
    801
  • PTX ISA 之 comparisions 小结

    http://docs.nvidia.com/cuda/parallel-thread-execution/index.html#comparisons integer meaning sig...

    2017-02-28 13:52
    151
  • PTX ISA 之 原子操作 atom 的小结

    关于 原子操作 atom 的小结atomAtomic reduction operations for thread-to-thread communication.语法atom{.space}{.s...

    2017-03-01 16:15
    325
  • PTX ISA 之 同步指令 bar & membar

    barBarrier synchronization.Syntaxbar.sync a{, b}; bar.arrive a, b;bar.red.popc.u32 d, a{, b...

    2017-03-07 23:37
    255
  • CUDA 编程 之 二进制工具与反编译

    1.Overview1.1什么是CUDA二进制文件cuda 二进制文件 (.cubin .elf)是一种 ELF格式的文件,其中包含可执行代码部分,还包含了一些 符号、relocator、debug ...

    2017-03-15 23:22
    350
  • CUDA 编程 之 基本概念理解

    CUDA 基本概念理解grid 分配给每个kernel总的线程资源,可以是一维二维三维的,其中包含许多block。 共享global memory block grid 的组成单位,线程块嘛,分配到 ...

    2017-04-27 10:14
    185
  • CUDA 编程 之 编译问题小记

    在编译cuda程序时出现 这个问题obj/release/mySobeldllComb.cu_o relocation R_X86_64_32 against `a local symbol' can...

    2017-05-08 10:09
    322
  • GPU架构基础 之 关于CUDA中线程访存的关系

    关于CUDA中线程访存的关系,

    2015-11-16 20:25
    367
  • NVCC 分歩 编译 CUDA 程序

    先上一张大图,nviDIA官方文档的编译流程图 完整的说明了如何从一个 .cu or .cpp 生成一个可执行的文件。1.只打印,不运行nvcc -O2 -c backprop_cuda.cu ...

    2016-12-25 14:05
    934
  • CUDA 编程 之 配置cache函数

    设置L1/shared mem 配置函数Sets the preferred cache configuration for a device function.__host__ ​cudaError...

    2017-02-27 21:49
    266
  • PTX ISA 之 volatile 的用法

    字面意思挥发性的,不稳定的 用法用于ld/st指令 ld.volatile{.ss}.type d, [a]; // load from address ld.volatile{.ss}.vec.ty...

    2017-02-28 23:30
    318
  • GPU 架构基础 之 Concurrent Kernel Execution in Fermi arch & later

    Fermi supports concurrent kernel execution, where different kernels of the same application context...

    2017-03-07 14:35
    257

Cache 架构
42305
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部