- 博客(12)
- 资源 (17)
- 收藏
- 关注
原创 CUDA(15)之CUDA bank conflict in Shared Memory
摘要本文主要讲述如何避免CUDA中的bank conflict。 1. 为什么会导致bank conflict总而言之,目的就是避免出现:同一个bank中两个或者两个以上不同的元素被half warp中的并行的threads同时访问的状况,这里同一个bank两个不同的元素被同时访问性能减至1/2,三个不同元素被同时访问,性能减至1/3,以此类推。 2. 怎么解...
2016-09-30 10:49:17 985
原创 CUDA(14)之CUDA变量修饰符
摘要本文主要讲述CUDA的变量修饰符以及其性能。 1. 变量类型__device__:位于GPU显卡的内存(显存)中,用于全局通信,可称为global memory。 __shared__:共享存储,必须定义在kernal最前,定义时不能赋值。 __constant__:在kernal运行过程中不能修改,但是可以在__host__中修改。 __register...
2016-09-28 15:27:41 1452
原创 C/C++(6)移位运算符"<<"和">>"
摘要本文中的">"除了是重载输出标志,还是移位运算符号,而后者通常是人们陌生的,所以在这里就讲讲。1. 什么是一位运算符移位运算符就是在二进制的基础上对数字进行平移。按照平移的方向和填充数字的规则分为三种:>(带符号右移)和>>>(无符号右移),通常程序中“>”用得比较多。2. 实例化说明#include "stdafx.h"#include "windo
2016-09-28 11:04:46 1028
原创 C/C++(5)实现大数据文件的内存映射机制
摘要本文主要讲述大量数据的文件的内存映射机制的实现。1. 内存映射内存映射文件,是由一个文件到一块内存的映射。Win32提供了允许应用程序把文件映射到一个进程的函数 (CreateFileMapping)。内存映射文件与虚拟内存有些类似,通过内存映射文件可以保留一个地址空间的区域,同时将物理存储器提交给此区域,内存文件映射的物理存储器来自一个已经存在于磁盘上的文件,而且在对该文
2016-09-26 14:57:49 4270 1
原创 C/C++(4)堆和栈
摘要这里的堆栈是操作系统中的堆栈,和数据结构中堆栈完全是两码事。1. 堆栈的概念堆:一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收,分配方式倒是类似于链表。栈:由操作系统自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2. 概念实例化int main(){ char *Data; Data = (c
2016-09-26 11:57:30 454
原创 C/C++(2)实现txt数据读入内存/CPU缓存
摘要C实现将txt数据读入内存/CPU缓存的函数,不多说,实现如下。 1. 实现代码 #include "stdafx.h"#include <stdio.h>#include <stdlib.h>int filelength(FILE *fp);char *readfile(char *path);int main(void){ c...
2016-09-24 18:01:46 1530
原创 Ubuntu windows双系统
摘要Ubuntu和Windows双系统的注意事项。 注意分一个100M的盘挂载到/boot下,分1G的盘挂载到交换空间swap上,分10G的盘挂载到/下,分最大的盘挂载到/home下。重中之重是要求/boot和swap这两个分区要为主分区,其他两个为逻辑分区。因为这个/boot就是启动引导盘,必须要是主分区的,这样安装之后就可以有双系统了。...
2016-09-23 20:07:06 360
原创 CUDA(13)之CUDA并行模型
摘要本文主要讲讲CUDA并行模型,主要包括:并发线程模型,并行函数调度模型,以及并行内存模型三个部分。 1. 并发线程模型CUDA的threadIdx排列方式(或者说是block的维度)是空间三维的,而且,uniqueThreadIdx都是唯一编号的,因此不管线程的排列方式与其唯一的编号二者之间存在一个索引的映射方程。对于一维grid(x维度),一维block(x维度)的线程排...
2016-09-22 15:14:22 1270
原创 CUDA(12)之一个的并行优化定理
摘要本文主要讲述一个并行优化理论,发展自 Amdahld 定理和 Gustafson 定理。 1. Amdahld定理(相对于串行程序而言,并行程序的加速率)程序中可并行代码的比例为p, 并行处理器的数目为n,串行程序耗时为:并行程序耗时为:所以,程序并行化后的加速率=串行程序耗时/并行程序耗时,即产生Amdahld定理如下: 2. Gustafso...
2016-09-19 11:27:18 1379
原创 部分发表的论文
摘要部分已经发表并出版的论文,欢迎来信交流!IEEE官方链接(收费)http://ieeexplore.ieee.org/document/7410263/Google Scholar链接(免费) https://xueshu.glgoo.org/scholar?hl=zh-CN&q=An+enhanced+algorithm+based+on+path
2016-09-18 18:03:18 564
原创 Github for windows无法安装
摘要本文主要讲述如何解决github在windows下无法安装的问题。 1. 问题http://github-windows.s3.amazonaws.com/GitHub.application 无法下载。 2. 原因IE浏览器无法打开http://github-windows.s3.amazonaws.com/GitHub.application该网址。 3...
2016-09-15 15:16:03 520
原创 惠普打印机换硒鼓(墨盒)
摘要本文主要讲述惠普打印机如何更换硒鼓(墨盒)。1. 打开打印机盖2. 如下图,红色圈出的就是硒鼓的手柄,抓住手柄,顺着滑倒,很容易拿出硒鼓3. 取出旧硒鼓,放入新硒鼓4. 另外,关上盖子的时候,记得要用上洪荒之力;否则打印机可能会提示盖子没盖好!
2016-09-04 15:33:52 5838
hyperledger-fabric-readthedocs-io-en-v2.2.1.pdf
2021-01-27
LibreOffice Draw 之网络图示模板 VRTnetworkequipment_1.2.0-lo
2018-08-01
1999年到2018年香港房地产走势数据
2018-04-02
GeoIP Databases of Country and City
2017-06-06
Performance analysis of the Blockchain
2017-01-19
An introduction to Blockchain that is a supporting technology of Bitcoin.
2017-01-03
Linux Kervel Version 1.0 (open source)
2017-01-03
GPU与MATLAB混合编程之书本实现代码
2016-07-15
Totem拓扑数据
2016-05-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人