- 博客(16)
- 收藏
- 关注
原创 DDR基本知识
一、对DDR中Bank(逻辑Bank)、Rank(物理Bank)的整理首先,在DDR的内部,数据是以阵列的形式存储的,通过指定的行和列就可以对目标数据进行读/写。 (1)Bank DDR中的逻辑Bank就是指DDR中指存储阵列的个数,由于制造工艺的原因,存储阵列的规模一般不会做的太大, 并且数据位宽一般是4/8/16。一个时钟周期内只允许对一个逻辑BANK进行操作,而不是芯片组对内存芯片内...
2020-01-02 19:38:00 6261 2
转载 (转)GPU的存储结构
学习了一下GPU的存储结构,有一篇很好的文章,收藏一下【CUDA】学习记录(7)- Global MemoryMemorykernel性能高低不仅仅和线程的执行方式相关,还和存储器的访问和管理密切相关。众所周知,memory的操作在讲求效率的语言中占有极重的地位。low-latency和high-bandwidth是高性能的理想情况。但是购买拥有大容量,高性能的memory是不现实的,或者不...
2019-06-25 19:34:07 2757
转载 5.28日记
转载自:seekg()/seekp()与tellg()/tellp()的用法详解C++覆盖或删除指定位置的文件内容一、读取文件的特定位置读写操作的定位指针对输入流操作:seekg()与tellg()对输出流操作:seekp()与tellp()下面以输入流函数为例介绍用法:seekg()是对输入文件定位,它有两个参数:第一个参数是偏移量,第二个参数是基地址。对于第一个参数,可以是正...
2019-05-28 19:17:55 200
转载 Make只执行第一句指令
Makefile只生成第一个目标,当然,要是想一次生成多个目标,可以C/C++ code?123.PHONY:all AA BBall:AA BB
2019-05-27 12:23:05 1049
原创 pagerank学习
一、算法简介 佩奇排名(PageRank),又称网页排名、谷歌左侧排名、PR,是Google公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法。 佩奇排名本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页的重要性的算法。 算法计算...
2019-05-14 18:43:46 212
原创 CUDA学习笔记(LU分解)
nbsp; 最近在学习LU的并行加速,从paper中得到了一些idea,就想着用GPU来实现一下。学习CUDA的过程中踩了不少坑,不过最终还是完成了测试。一、LU算法LU 分解是计算机做矩阵运算过程中重要的一步,通过将矩阵分解为一个上三角矩阵U和下三角矩阵L,能够有效的缩短计算时间。LU分解的计算过程如下,采用高斯消元法。基本算法void lud_b...
2019-05-14 12:58:32 6171 6
原创 学习dijkstra算法并C++实现
一、算法描述dijkstra是一种单源最短路径算法,主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。 naive version的时间复杂度为O(N2),通过堆排序优化可以减少为O((m+n)logn)。二、算法执行过程概括的来说,就是迭代N次,每次确定一个节点到source的最短路径,并以该节点作为中转,更新其他未确定节点到source的距离。(1)确定一个节点到source的...
2019-04-20 18:15:16 479
转载 notepad使用回车与换行
转载于:http://www.pythontab.com/html/2017/linuxkaiyuan_0115/1116.html一、回车与换行定义回车 \r 本义是光标重新回到本行开头,r的英文return。换行 \n 本义是光标往下一行(不一定到下一行行首),n的英文newline。不同操作系统下的含义:\n: UNIX 系统行末结束符\r\n: window 系统行末结束符...
2019-03-19 12:02:57 1619
原创 leetcode137:只出现一次的数字详解
一、题目说明给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现了三次。找出那个只出现了一次的元素。说明:你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?示例 1: 输入: [2,2,3,2] 输出: 3示例 2: 输入: [0,1,0,1,0,1,99] 输出: 99二、思路解析 学习评论区第一大佬的i...
2019-03-13 17:22:25 170
转载 OpenDwarf Benchmark配置遇到的坑
#转自https://yq.aliyun.com/articles/497392Error:.ibtoolize: AC_CONFIG_MACRO_DIR([./aclocal]) conflicts with ACLOCAL_AMFLAGS=-I ./aclocal执行libtoolize遇到上面提示的错误时,可能是因为configure.ac和Makefile.am文件是dos格式导致的,...
2019-03-11 15:21:18 249
原创 Parboil BenchMark下载及使用
最近项目需要用到Parboil这部分的testbench,就花费了一天的时间学习如何使用。虽然过程中出现了不少问题,但最后还是运行成功了。话不多说,show you step。一、注意事项1、一些Parboil使用的是py2.x版本的语法,所以需要装一个python2.x,这里学习了一下如何利用Aconda安装多个版本的python.aconda教程贴在此:https://www.zhihu...
2019-03-06 17:34:02 1175 1
原创 字符串匹配算法学习笔记
前言 最近接触了很多字符串匹配算法。包括暴力的Naive算法,通过增加移动步长来减少移动次数的BM算法、KMP算法,sundy算法,以及多模式串匹配的AC自动机。今天总结一下各类算法的实现原理以及时间复杂度。 首先,各类子字符串匹配算法从图形的角度理解都是滑动的过程,首先将母串的头部和模式串的头部对齐,然后逐一比较每个元素,如果相同则比较成功。否则将模式串向后滑动一步,重新按位比较。**而不同...
2019-02-27 21:09:54 155
原创 排序算法总结
总结一下递归排序和非递归排序算法的特点从 最好情况、最坏情况、平均情况时间复杂度,算法的内存消耗和稳定性方面考虑。极客时间版权所有: https://time.geekbang.org/column/article/41802####一、非递归排序1、冒泡排序 空间复杂度为 O(1),是一个原地排序算法。 只有交换才可以改变两个元素的前后顺序。为了保证冒泡排序算法的稳定性,两个元...
2018-12-25 14:52:02 514
原创 字符串数组的输入
题目编写一个程序,输入n(n<6)个字符串,输出其中最短字符串的有效长度,要求定义函数int minlen(char*str[]),int n),用于计算由n个元素的指针数组str中最短的字符串长度。code#include<iostream>#include&am
2018-12-17 20:34:03 11145
原创 Github学习笔记
GitHub库的使用笔记如何和UpStream保持同步如何和UpStream保持同步一、使用Github客户端1、登陆并且选择 Clone a Repository, 选择要克隆的库2、选择Branch,点击Merge into current branch,界面如下。选择upstream/master即可。3、登陆网页版github,发现repository已经和fork的来源同步...
2018-09-25 15:41:32 95
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人