判定程序属于计算密集和访存密集的方法 分析程序是计算密集(compute intensive)还是访存密集(Memory intensive)1)算出机器的单核峰值性能主频*SIMD宽度*2(如果存在乘加指令), CpuPeak2)测出机器峰值带宽用streaming测出实际带宽峰值,但是该峰值是所有处理器核的总和,需要除以实际物理核数(超线程不算),算出峰值带宽,MemPeak3)分析算法的计算访存比加减乘除
NVIDIA OpenACC 在线课程 (一) 学习笔记 1. pragma acc kernels[]{}表示可能存在并行性,由编译器分析并行性,并根据分析结果决定是否生成GPU kernels2. #pragma acc parallel loop 开发者已经知道该循环可以并行化,不用编译器再来分析并行性;只并行化当前修饰的循环且该循环可以是嵌套的;Independent clause开发者知道循环迭代间不
在caffe中添加自定义层 Caffe中添加自定义层[6,7]1)头文件路径:py-faster-rcnn/caffe-fast-rcnn/include/caffe/layers2)CPP或者CU文件fasterrcnn_huawei/py-faster-rcnn/caffe-fast-rcnn/src/caffe/layers3)caffe.proto定义该层的参数py-faste
ubuntu 14.04 配置samba账户 1)安装samba相关软件;2)添加用户smbpasswd -a zhaotianwang3)修改/etc/samba/smb.conf在里面添加如下内容,就可以让每个用户访问默认目录[zhaotianwang]comment = user for zhaotianwangpath = /home/zhaotianwangvalid user = zhaotianw
CMake使用说明 How can I add a dependency to a source file which is generated in a subdirectory?Rules created with ADD_CUSTOM_COMMAND as above have scope only in the directory in which they are specified. If t
(centos)安装latex及使用技巧说明 1)安装latextexlive版本中只有tex和pdftex命令,并没有latex和pdflatex命令。但是,后者似乎前者的符号链接而已。要想安装latex等,可以安装yum install texlive-latex2)安装tabu.dtx, tabu.ins(需要生成tabu.sty)下载这两个文件;3)有时候可能某些sty文件找不到,最好的方法是自己下载安
用clang编译SPEC2006 过程中的问题(与gcc,ld相关) 1. 重复定义__strcspn_c1编译401.bzip2时错误/usr/include/bits/string2.h:972: multiple definition of `__strcspn_c1'bgm.o:/usr/include/bits/string2.h:972: first defined heredinkini.o: In function `__strcsp
centos 安装软件 查找软件仓库中是否有现成的安装包,yum list | grep ***1)安装gcc工具集yum install gcc yum install gcc-c++yum install gcc-c++yum install gcc-gfortran.x86_64gdb的较新版本可以直接下载源代码进行编译,比较简单。2)安装Rscript环境
git 使用技巧总结 消除某次已经push的commit某些时候错误提交或者提交了错误的代码,可以撤回该次提交。首先保证当前目录下没有未提交的修改。$git revert 78246899f020b0d5cad7ee0d27f8ff12571eef5c$git push但是还想在本地保留这些修改,有两个方法:1)如果已经生成patch的情况下,可以直接打patch实现,在这种方法下,如果库代码已经被
windows7下,使得excel能否在不同窗口中打开多个文件 这是WINDOWS 7下的方法,该方法在win7下,office2010版本中验证是有效的。1、打开REGEDIT2、在HKEY_CLASSES_ROOT\Excel.Sheet.8\shell\Open目录下删除ddeexec这个目录和command下的那个command的键值。3、将command文件夹下的默认数据改为 C:\Program Files\Microsof
svn 使用指南(经验总结版) 提交数据当在本地修改 完程序后,需要提交,这时候命令是$ svn ci -m"fixup, finish...." ./*.cpp ./*.h ......通常在提交的时候,需要给一些标注或者解释信息,便于以后查看该版本所做的主要修改,但是通过-m” ”或者 -message" "给出信息时,不妨便进行编辑,那么用户可以在提交时,不添加该项$svn ci ./xxx.cpp这
搭建samba服务 centos 在centos搭建samba的过程,应该同样适用于ubuntu。1)安装sambayum install samba2) 启动samba服务#service smb start#service nmb start设置开启自启动该服务chkconfig --level 35 smb onchkconfig --level 35 nmb on3)关闭防火墙
ubuntu上搭建工作环境 版本ubuntu desktop, v12.4, v13.10.优点:1)绚丽易用的可视化环境;2)丰富的可用package,在这点上比centos强太多,后者更新较慢;不足:1)在笔记本上运行较慢,笔记本很快温度变高;(特别是ThinkPad上)2)是桌面端系统,所以作为一个用来进行程序开发的人来说需要装一些其他软件,但是方便易用的package安装方式减轻了这一过程的负
任正非谈:华为会怎么失败,华为会怎么垮掉? 虎嗅注:该文节选自任正非四月中旬与上研专家座谈会上的讲话。在座谈会上,任正非就技术创新、华为的发展方向以及潜在的风险谈了自己的看法。我们会怎么失败,华为会怎么垮掉?历史上多少大公司是在非常成功之后走向大衰弱。70年代日本电子工业很成功,钱多到可以把美国买下了。日本在模拟电子很成功,但在数字转型的时候保守了,让美国超越了。美国CT领域也保守了被华为超越了,但后来,美国又从IT领域重新
SPEC CPU2006的执行命令 The execution command options for SPEC CPU2006 C/C++ benchmark. 另外也有针对每个程序的Makefile,如果需要可以给我发邮件。1) 400.perlbenchrunspec --config linux-amd64-gcc470.cfg -T base -i test --noreportable 400.perlb
安装SpecCPU2006 on Linux of CentOS6.3, gcc4.4.7 由于在tools/bin目录中只有ia64-linux,所以在直接运行./install.sh脚本时,系统会提示直接重新安装tools工具集。该过程如1.1.1 所示。另外一个做法就是指定可用的现成的工具集,例如linux-suse101-AMD64,首先在CPU2006/tools/bk_bin目录中选择合适的工具集并拷贝到CPU2006/tools/bin目录中,(当前以 linux-suse
How to identify a research problem 说明:转载 计算所包云岗博士的博文。【这是自己在2012年5月16日随手记录的,一直没想过与大家分享。一方面觉得自己研究水平还比较初级,似乎都是大牛才有资格介绍这种话题;另一方面,觉得自己的很多见解也是比较肤浅,而英语写作水平也不高,公开出来很可能会贻笑大方。但昨天看到一篇文章,忽然心中顿悟,觉得自己这个阶段更需要与其他人交流分享。】My Story at
Compiler developer position available at Qualcomm Qualcomm CDMA Technologies (QCT) is the largest provider of 3G chipset and software technology in the world, with chipsets shipped to more than 50 customers and powering the majority of all 3G devices
对David Kuck的一个电话访谈 About the InterviewDAVID KUCK: An Interview Conducted by Andrew Goldstein, Center for the History of Electrical Engineering, August 15, 1991Interview #132 for the Center for the History of Ele
安装gcc/c++/fortran, centos6.3 rpm rpm -ivh mpfr-2.4.1-6.el6.x86_64.rpm;rpm -ivh cpp-4.4.6-4.el6.x86_64.rpm ;rpm -ivh kernel-headers-2.6.32-279.el6.x86_64.rpm;rpm -ivh glibc-headers-2.12-1.80.el6.x86_64.rpm ;rpm -ivh glibc-deve
JOB AD: PathScale's compiler frontend/GPGPU team == JOB POSTING == PathScale's compiler team is looking for individuals interested in GPGPU, C++, Visual Studio compatibility and compiler frontend (clang) work. Most of the work will be on o
Summer of code proposal: add directive to uniquely identify loops of interest Dear all,I would like to propose an average technical project that might have a great use in many parts/derivatives of LLVM, including ours.Consider you have dozens of regression tests in high
JOB: Compiler engineering positions @ AMD Sunnyvale, CA 1. Senior Compiler Engineer, Stream Compute Team - AMD, Sunnyvale, CaliforniaWe are currently looking for a senior software engineer to join the core team developing our OpenCL compiler stack for
part of PLDI 2013 accepted papers I collcet these data through Google (21 papers now), so maybe there are some errors on the data. There 2 papers from IBM realted, 3 papers related Microsoft, 2 papers from colorado, 1 paper from Pur
世纪图灵纪念 同事写的非常好的一片文章,转载在此以共享。http://blog.sciencenet.cn/blog-414166-628109.html -----------------------------------------------------世纪图灵纪念包云岗 中科院计算技术研究所 1912年“计算机科学之父”阿伦.图灵(AlanTuring)诞生。1930年代,
Technical Perspective: Proving Programs Continuous By Andreas Zeller Communications of the ACM, Vol. 55 No. 8, Page 10610.1145/2240236.2240261Proving a program's correctness is usually an all-or-nothing game. Either a program is correct with
N个数中,选取M个数 从N个数中选取M个不同的数,共有多少种选法?并将结果打印出来。解法:采用divide-conquer方法。f(N,M) = f(N-1,M-1) + f(N-1, M); 具体代码如下:#include#define N 100#define M 5int total = 0;int func(int n, int m, int *sta
thinkpad t420 centos 配置无线网 1) check which wireless network card03:00.0 Network controller: Realtek Semiconductor Co., Ltd. RTL8188CE 802.11b/g/n WiFi Adapter (rev 01)RTL8188CE and RTL8192CE shared the same driver2) downlo
Cloud Computing Pioneer Dies John McCarthy, creator of the Lisp programming language and pioneer in utility computing—the forerunner of today's cloud computing—died Sunday in Stanford, California. He was 84.McCarthy was a
关于自动并行化的访谈 When I started my PhD.-thesis a couple of years ago, I took some time to look at auto-parallelizing compilers and research. After all, I wanted to work on making parallel programming easier, and the b
世界最小晶体管问世:仅由7个原子构成 新浪科技讯北京时间5月26日消息据物理学家组织网报道,美国与澳大利亚科学家成功制造出世界上最小的晶体管——由7个原子在单晶硅表面构成的一个“量子点”,标志着我们向计算能力的新时代迈出了重要一步。 量子点(quantum dot)是纳米大小的发光晶体,有时也被称为“人造原子”。虽
东芝科学家向量子计算机迈进一大步 6月3日消息,据外电报道,来自东芝在英国剑桥设立的研究中心的科学家周三称,他们研制出的纠缠态发光二极管(Entangled Light Emitting Diode,ELED)为制造出超级强大的半导体芯片开辟了道路。量子计算机在理论上可以同时用各种方法解决同一个问题,而如今速度最
量子计算机首次正式投入商用 加拿大量子计算公司D-Wave近日正式发布了全球第一款商用型量子计算机“D-Wave One”,量子电脑的梦想距离我们又近了一大步。其实早在2007年初,D-Wave公司就展示了全球第一台商用实用型量子计算机“Orion”(猎户座),不过严格来说当时那套系统还算不上真正意义的量子
磁微处理器挑战计算机最低能耗极限 根据加州大学伯克利分校电力工程师的研究,未来计算机可能使用一种由纳米磁铁制作的处理器,仅消耗物理定律所限的最低能量,这就是磁微处理器计算机。目前的硅基微处理器芯片依赖于电流,也就是运动电子,会产生大量的废热。如果用纳米磁铁,就像微型的冰箱磁铁那样,用来进行存储、逻辑运算与开关操作
perl中简单printf操作 在perl程序中,读入下面一行c代码:printf("%d", number);将其保存到到变量$line中,然后将其输出到文件句柄$out中,下面两种做法会有什么差异呢?1)printf $out $line;2)printf $out ("%s", $line);如果第一种做
what is first-order language A language in which the quantifiers contain only variables ranging over individuals and the functions have as their arguments only individual variables or constants. In a second-order language the variables of the quantifiers may range over functions
perl实现设置环境变量并运行程序 需求:perl脚本控制实验过程,由于不同的应用程序需要设置不同的实验环境,因此需要根据输入重置环境变量。环境变量的初始化方法为:source env.sh与source henv.sh,编译命令为$compile,执行命令为$run,要求必须在重置的环境变量里编译执行程序。 在perl脚本里通过system调用系统调用实现,但是system都是单独的进程,一旦返回后,其建立的环境也会丢失,因此需要由system派生的进程同时执行建立环境、编译与运行工作(至于为什
simd编程 最近比较关注simd相关内容,刚开始看,目前尚没有一个判断。觉得在接下来CPU与GPU相互融合的过程中,simd的使用可能会是一个重要的内容。 但是如何做呢?没有想清楚,但是有一个朦胧的目标,就是能够在更多的机会下使用simd,并能大大提高程序的性能。
tegra 2新闻发布会上,英伟达透漏将要做基于ARM的CPU+GPU 译自 PC world 2011.1.5 By Nate Ralph, PC World 在新闻发布会将要结束时,nvidai CEO Jen-Hsun Huang 透漏了Nvidia's "Project Denver."在该项目中,英伟达会利用ARM的处理器来做CPU+GPU,而且微软也将支持SOC系统的操作系统,看来英伟达要蚕食X86的其他市场了。
GPU-based Supercomputing Could Face Price Hikes Tiffany Trader, Associate Editor, HPCwire The end is in sight for cheap GPU-based supercomputing, according to an International Science Grid This Week (iSGTW) opinion piece out this week. Author Greg Pfister argues that CUDA de
多核时代的并行编程模型应该是什么样子 目前来说,单节点的并行编程模型有OpenMP、MPI等;集群上有MPI、UPC等。但是这些编程模型再带来某一些好处的同时,又带来了其他问题,所以如何设计一个能够让客户满意的编程模型,是一个非常艰难的工作。 对于并行编程模型,大家关注的问题包括可编程性、性能、可调试性、正确性以及安全性等各个方面的问题。但是通常对于用户来说比较关注的是可编程性以及性能。以UPC为例,UPC做为一个PGAS的编程模型,从出现的时候就在可编程性被大家寄予厚望。但是,upc在出现后大约10年时间里,仍然
为什么在移动互联设备上会有这么多操作系统 在PC机上,大家用到的操作系统数目很少,大概包括windows, Mac OS, Linux几个系列。如果从市场份额上来讲,个人电脑上的主要操作系统可能就是windows系列与Mac系列,而linux或者unix大多是用在服务 器上,当然,最近ubuntu的出现,给linux的可用性
苹果引发的移动互联设备的操作系统战争 最近关于嵌入式OS真的是非常热,引发大家眼球与热情的是apple,其ipod, iphone与新近推出的ipad在不断的冲击消费电子产品领域,让我们感到奇怪的是,在苹果推出这些产品的时候,那些传统的手机、电脑生产商在干什么?他们难道都失去思考与创新能力了。事情大概不是这么简单。 “最难超越的永远是自己”,对于很多电子消费品生产商来说的确如此。准确讲,苹果卖的不是电子消费品硬件,
中国创新之路(一) 最近一段时间,国内很多行业的领头企业或者有理想的企业都开始走上了真正的技术创新道路。通信领域,中国的真正的世界级企业,而且有希望成为行业第一名的华为公司,在第四代通信技术标准LTE上占据领先地位,而在基础技术方面,也在寻求拥有自己的处理器芯片以及对应的软件技术,当拥有了标准与建设通信网络的核心技术后,华为将成为真正的创新高科技企业。汽车领域,吉利收购沃尔沃也预示着民企开始走上较高级汽
The Researcher's Bible Alan Bundy, Ben du Boulay, Jim Howe and Gordon Plotkin 1985Including contributions by Graeme Ritchie and Peter Ross.This version: 9 November 2004.AbstractGetting a Ph.D. or M.Phil is h
Ways To Measure Research Although young computer scientists are told that they need to produceresearch results, no exact requirements are specified.Instead, researchers are usually given vague encouragement to achieve
图灵奖获奖名单历史 1.1966年图灵奖获得者:艾伦•佩利(A. J. Perlis) PhD, MIT; Prof, Yale (was Prof at CMU) (deceased) —— ALCOL语言和计算机科学的“催生者” 2.1967年图灵奖获得者:莫里斯•威尔克斯(Maurice V. Wilkes) PhD, Cambridge; Prof, Cambridge ——
并行编程模型 新丁 ANIC 昨天在CSDN上看到了关于 ANIC的新闻,anic是一个处于开发过程中开源项目,建立在google code上,其讨论在google group上,但由于政府的负责任 ,已经登录不上去了,所以只看到其部分内容。 被其吸引是因为其号称“比C快、比java安全,比脚本简单”,最近一直在考虑编程模型,在由重核搭建的集群上,如何容易的写出高性能的并行程序是目前HPC领域的一个重大挑战,即使在网
HPPCChina会议全记录 整理 说明:将自己在会议期间的一些摘抄整理出来,主要是一些提纲性的内容或者要点,可能存在不准确的地方或者记录有误的地方;另外最后一部分是我的会议总结,由于有了前面的内容,所以就写的很抽象或者说比较虚,仅供大家参考。一、大会报告系列报告一:陈国良从单一编程模型到分层编程模型1、模型要包括下面几个内容:² 机器参数²
MPI程序中的多进程写冲突问题的解决与遗留问题 最近碰到关于多进程写文件的问题,问题的描述如下:有一个MPI程序,会以n个进程运行程序,然后在每个进程结束的时候向timer.txt文件写入数据。 开始的时候,用的是普通的写文件操作,显然不行,若是各个进程结束的时间相差较大,不会有错误,若是执行时间相差很小,大约是几是个毫秒,就会导致出错,其实这种做法本身就存在问题。 后来,参考unix环境高级编程提到的方法,又试用了其中三种方法
动态数组与数组大小 前几天,写一个C程序,很久没有写C得程序,觉得有些东西又开始忘记了。1、如何获得数组得长度例如 char a[100]; char *b = "hello world"; 若像上面两种情况,可以通过 int len = sizeof( a );就可以得到。但是对于下面情况:int *c;c = malloc( num * sizeof(int) );分析一下,觉得len = size
富士通 面试笔试题 1、 四只乌龟在边长为3米的正方形四个角上,以每秒1厘米的速度同时匀速爬行,每只乌龟爬行的方向都是追击(注意:是追击)其右邻角上的乌龟,问经过多少时间他们才能在正方形的中心碰头? 补充1: 以正方形中心为原点建立直角坐标系,假定四个乌龟的初始坐标均处于坐标轴上,距离原点均为 a = 150√2cm 在任意时刻,乌龟的运动方向是其运动轨迹曲线的切线,那么,对于第一象限乌龟的坐标为P(
指针专题---非常棒的文章 一、数组的指针、指针数组以及指向指针的指针 考虑数组的指针的时候我们要同时考虑类型和维数这两个属性。换一句话,就是说一个数组排除在其中存储的数值,那么可以用类型和维数来位置表示他的种类。A)一维数组 在c和c++中数组的指针就是数组的起始地址(也就第一个元素的地址),而且标准文档规定数组名代表数组的地址(这是地址数值层面的数组表示)。例如:1int a[10];2int *p;
vim 使用技巧[zz] vim 使用技巧[zz]vim 使用技巧作者: camry.wu@gmail.com我是 vim 粉丝, 用了许久, 有一些自己的感受, 又到处挖到一些别人的技巧. 感觉对 vim粉丝比较有用, 就把它记在这儿. 希望借此文套出大家自己的巧活, 就正应了抛砖引玉的古话了.先稍为介绍一下 vim. vi 是 unix/linux 下极为普遍的一种文本编辑器, 大部分机器上都有. vi
彻底了解指针数组,数组指针,以及函数指针,以及堆中的分配规则 2004年7月31日星期六 第二次更新,增加了对象的堆内存分配,细化了指针数组和数组指针内存的说明 ! 昨天给0405班辅导,当他们问我指针数组的问题的时候,由于好久没用,感觉有些陌生了,所以今天归纳总结了一下,希望以后的朋友可以少走些弯路:) 一 :关于指针和堆的内存分配 先来介绍一下指针 : 指针一种类型,
转贴 CxImage类库使用说明 一。CxImage类库简介这只是翻译了CxImage开源项目主页上的部分简介及简单使用。CxImage类库是一 个优秀的图像操作类库。它可以快捷地存取、显示、转换各种图像。有的读者可能说,有那么多优秀的图形库,如OpenIL,FreeImage, PaintLib等等,它们可谓是功能强大,齐全,没必要用其它的类库。但我要说,这些类库基本上没有免费的,使用这些类库,你要被这样那样的许可协议所
2007 百度面试题 *1. 阶乘嵌套的两个数进行比较, eg. 50!!!!!! 85!!!!2. 很多的url去重*3. 大整数的加减乘除*4. 很多的记录(1千万), 统计里面的频度, 把前5%和后5%的输出来*5. 01矩阵, 求最大子矩阵. 算法期末考试题. 6. 判断一个字符串是不是合法的点分十进制ip.7. 信号量机制, 消费者, 生产者. 尽量最快. 8. 一个可以产生1~5随机数的函数, 写一个1~
常见的数据类型的长度 几种常见的数据类型包括:int, short int,long int, double,float, char,可以划分数值类(整型、浮点型),字符类,各种数据类的字长一般与机器字长相关联。1、 int, short int, long int(默认为带符号类型signed):int一般为一个机器字长,short int 为半个机器字长,而在32位机器中,long int 与 int 有
百度面试题 一、选择题:15 分 共 10 题1. 已知一个线性表(38,25,74,63,52,48),采用的散列函数为 Hash($Key)=$Key mod 7,将元素散列到表长为7的哈希表中存储。请选择后面两种冲突解决方法分别应用在该散列表上进行等概率成功查找的平均查找长度,拉链法,线性探测法.A. 1.0 B. 1.5 C. 1.7 D. 2.0 E. 2.3F. 7/6 G. 4