自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

。。。。

努力工作!

  • 博客(64)
  • 收藏
  • 关注

原创 编译器选项的查询和编译链接器介绍

对于高性能计算,为何要谈编译器?高性能计算的关键在于优化,而编译器就包含了很多选项,其中很多选项也是为了优化的。所以,编译器的选项的了解和学习也是必要的。(1)MS编译器选项查询http://msdn.microsoft.com/zh-cn/library/9s7c9wdw(v=VS.100).aspx(2)Intel® Parallel Composer 2011编译器文

2011-11-16 22:04:07 5521

原创 WAC是神马!(HTML/Android)

WAC:wholesale applications community(大规模应用软件开发联盟)官网:http://www.wacapps.net/我所知道的,WAC标准最开始是由一群电信营业商推出的,包括移动在内,作为移动平台的一个标准,提供一个WAC的runtime,使用HTML开发,从而一次编写,到处运行。多余的不多说,类似于Phonegap这样的,只是Phonegap提供

2011-11-30 20:54:26 3062

原创 使用Intel编译器(2)向量化(1)自动向量化基础

参考手册:http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm说明:本系列文章为个人笔记,如有不正确之处,请参考官方相关文档,如果错误发现,我会尽量更新修改。另外,以下内容不保证对于所有版本的编译器都正确,编译器的实

2011-11-30 16:16:22 8336

原创 计算机编程相关词汇、术语收集

Summary:记录和计算机有关的“形容词”、词汇、术语等。(不断更新)portable:本意:a. 便于携带的,手提式的;轻便的在计算机中,portable经常使用,表示的是“可移植的”,当然了,port就是移植的含义了。example: OpenMP provides a portable, scalable model for developers of sh

2011-11-30 13:25:51 1492

原创 使用Intel编译器(1)并行化(4)向导自动并行化(GAP)

参考手册:http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm说明:本系列文章为个人笔记,如有不正确之处,请参考官方相关文档,如果错误发现,我会尽量更新修改。另外,以下内容不保证对于所有版本的编译器都正确,编译器的实

2011-11-30 12:35:14 1124 1

原创 使用Intel编译器(1)并行化(3)自动并行化相关的选项和总结

参考手册:http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm说明:本系列文章为个人笔记,如有不正确之处,请参考官方相关文档,如果错误发现,我会尽量更新修改。另外,以下内容不保证对于所有版本的编译器都正确,编译器的实

2011-11-29 21:55:56 1443 1

原创 使用Intel编译器(1)并行化(2)自动并行化代码相关

参考手册:http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm说明:本系列文章为个人笔记,如有不正确之处,请参考官方相关文档,如果错误发现,我会尽量更新修改。另外,以下内容不保证对于所有版本的编译器都正确,编译器的实

2011-11-29 21:06:18 2099 1

原创 使用Intel编译器(1)并行化(1)自动并行化基础

参考手册:http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011Update/compiler_c/index.htm说明:本系列文章为个人笔记,如有不正确之处,请参考官方相关文档,如果错误发现,我会尽量更新修改。另外,以下内容不保证对于所有版本的编译器都正确,编译器的实

2011-11-29 16:07:21 6835 2

原创 win32汇编入门了解(3)VS生成的代码里面的几个常见的基本伪指令

更多资料:http://blog.csdn.net/gengshenghong/article/details/7017712(1)TITLE&NAMETITLE:用于定义文件名类似的一个伪指令是NAME,使用NAME定义模块名。说明:NAME和TITLE伪指令都不是必须的,如果程序中既没有NAME也没有TITLE,那么会使用源文件名作为模块名。程序中使用TITLE的好处是

2011-11-28 21:45:55 1111

原创 win32汇编入门了解(2)win32汇编基本结构

参考:http://book.51cto.com/art/200907/133040.htm(1)Summarywin32汇编和8086或者单片机汇编,总体来说都是类似的,不同的汇编的主要差别无非就是指令区别,伪指令的区别等。(2)模式定义.386 .model flat,stdcall option casemap:none 这些指令定义了程序使用的指令集、工作模

2011-11-28 21:22:16 2182

原创 win32汇编入门了解(1)环境搭建

说明:本系列内容不会详细讲解汇编的知识,只是记录我自己学习的一个过程,而且,我学习的目标不是打算写汇编,而是了解一点点win32汇编的知识,只是为了让自己能读懂最基本的汇编。另外,win32汇编的核心应该还是在windows API的学习,这个不是我的重点,可以认为我只是打算学习一下http://book.51cto.com/art/200907/133699.htm这本书的第三章的内容!:)

2011-11-28 15:50:25 2441

原创 x86汇编学习资源

x86/x64 汇编语言:http://www.mouseos.com/assembly/index.htmlAoGo汇编小站:http://www.aogosoft.com/kip irvine(Intel 汇编程序设计)(Irvine32.lib可以在此下载到):http://www.kipirvine.com/asm/examples/index.

2011-11-27 21:44:49 1566

转载 使用NDK移植/编译开源库(5)sqlite3的编译

http://blog.csdn.net/zhych8419/article/details/6663848http://www.cnblogs.com/sardine/archive/2011/07/30/2121853.html

2011-11-27 19:19:47 2610

原创 使用NDK移植/编译开源库(4)libjpeg的编译

说明:libjpeg下载http://www.ijg.org/,jpegsrc.v8c.tar.gz。(下面是用的是Linux环境NDKr7版本)(1)使用NDK的GCC编译1. 解压jpeg包2. 建立两个文件夹,用于存储编译后的头文件和库文件等(下面的configure用到)。3. 在终端设置NDK的GCC路径如下:export SYSROOT=$NDK/platfor

2011-11-27 18:02:45 14522 26

原创 使用NDK移植/编译开源库(3)libpng的编译

libpng版本:lpng1233.zip说明:有了前面zlib的经验,这里编译的时候就尽量简略描述了。注意:libpng库依赖与zlib库,所以需要连接zlib或者和zlib一起编译,但是由于android的NDK本身是自带了zlib的,所以可以直接使用系统的zlib库来链接。下面是Android.mk的内容:LOCAL_PATH:= $(call my-dir)

2011-11-27 03:34:46 5213 5

原创 使用NDK移植/编译开源库(2)zlib的编译

说明:android的NDK本来就提供了zlib库,但是由于zlib相对简单,所以我第一次编译的就是zlib,只是为了了解一下大概如何编译的思路。这里使用的zlib的版本是zlib-1.2.3。(1)使用ndk-build的方式解压zlib包后,将其放入JNI文件夹下,目录树结构如下:NDK#tree -L 3.├── prj_zlib│   └── jni│

2011-11-27 02:45:19 8464 10

原创 使用NDK移植/编译开源库(1)准备

现在NDK版本已经r7了,在以前的使用NDK编译过几个开源库,发现时间久了,有些东西已经开发忘记了,所以重新编译一下这几个库,并记录一下,防止万一哪天还想编译别的库,也可以用来做一个参考。PS:尽管现在Android上一般还不至于完全使用NDK开发,但是,NDK或许还是有一定的发展空间的,谁知道呢。(1)安装NDK不多说,使用NDK工具链编译,当然要安装NDK这个交叉环境。(2)了解N

2011-11-27 01:00:29 5803 4

原创 Intel MKL基础(4)MKL函数举例(BLAS and Sparse BLAS)

MKL实现了BLAS和Spare BLAS和BLAS-like的函数。这部分函数主要分为以下部分:•BLAS Level 1 Routines (vector-vector operations) •BLAS Level 2 Routines (matrix-vector operations) •BLAS Level 3 Routines (matrix-matr

2011-11-26 21:18:54 14765

原创 Intel MKL基础(3)MKL函数分类

参考:http://software.intel.com/sites/products/documentation/hpc/mkl/mklman/index.htm(1)函数分类:根据MKL的手册可以知道,MKL函数主要分为以下几类(domains):BLASBLACSLAPACKScaLAPACK PBLASSparse Solver Vector Math

2011-11-25 16:52:20 6888

原创 Intel MKL基础(2)MKL的分层结构Layered Model Concept

参考:http://software.intel.com/sites/products/documentation/hpc/mkl/mkl_userguide_win/mkl_userguide_win.pdf(搜索“Layered Model Concept")为了支持多编译器和接口、不同的OpenMP实现、串行和多线程、广泛的处理器等,Intel MKL采用结构化设计。为了支持不同的接口、

2011-11-25 15:35:44 3972

原创 Intel MKL基础(1)了解MKL、MKL资源

Intel MKL:Intel Math Kernel Library,英特尔数学核心函数库。下面是从英特尔网站上相关MKL的产品介绍页面等,可以用于初步了解MKL:Intel MKL产品介绍:http://software.intel.com/zh-cn/articles/intel-mkl/ (http://software.intel.com/en-us/articles/int

2011-11-25 15:13:36 53705 1

原创 在C/C++代码中使用SSE等指令集的指令(5)SSE进行加法运算简单的性能测试

下面是一个简单的测试SSE指令性能的程序,可以看到明显的性能提升。(说明:程序中的timing.h使用的是http://blog.csdn.net/gengshenghong/article/details/6973086中介绍的时间间隔获取方法)#define WIN#include "timing.h"#include #include #include #define

2011-11-25 11:57:46 7618

原创 在C/C++代码中使用SSE等指令集的指令(4)SSE指令集Intrinsic函数使用

在http://blog.csdn.net/gengshenghong/article/details/7008682里面列举了一些手册,其中Intel Intrinsic Guide可以查询到所有的Intrinsic函数、对应的汇编指令以及如何使用等,所以,接下来就不全部进行分析,以下只分析其中一部分,从而了解如何在C/C++代码中使用这些高级指令集的基本方法,至于更多的指令的使用,查询手册就很

2011-11-25 11:06:20 32431 5

原创 在C/C++代码中使用SSE等指令集的指令(3)SSE指令集基础

相关参考:http://edu.gamfe.com/tutor/d/11820.htmlhttp://blog.163.com/chenqneu@126/blog/static/45738484200781392836677/http://dev.gameres.com/Program/Other/SSEjianjie.htmhttp://www.vckbase.com/d

2011-11-24 22:34:27 28298 4

原创 在C/C++代码中使用SSE等指令集的指令(2)参考手册

http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011/compiler_c/index.htm#intref_cls/common/intref_bk_sse.htmhttp://www.tommesani.com/Docs.htmlIntel架构开发人员手册:里面有很

2011-11-24 16:39:16 11057

原创 在C/C++代码中使用SSE等指令集的指令(1)介绍

我们知道,在C/C++代码中,可以插入汇编代码提高性能。现在的指令集有了很多的高级指令,如果我们希望使用这些高级指令来实现一些高效的算法,就可以在代码中嵌入汇编,使用SSE等高级指令,这是可行的,但是如果对汇编不太熟悉,不愿意使用汇编的人来说,其实也是可以的,这就是Compiler Intrinsics(http://msdn.microsoft.com/zh-cn/site/26td21ds)。

2011-11-24 15:35:21 23403 4

原创 CPU指令集介绍

(1)什么是指令集参考:http://product.pconline.com.cn/itbk/bjbzj/notebook/1109/2522116.html所谓指令集,就是CPU中用来计算和控制计算机系统的一套指令的集合,而每一种新型的CPU在设计时就规定了一系列与其他硬件电路相配合的指令系统。而指令集的先进与否,也关系到CPU的性能发挥,它也是CPU性能体现的一个重要标志。

2011-11-24 10:37:38 16299

原创 OpenMP3.0的新特性Task指令基础

从OpenMP3.0开始,OpenMP增加了task指令,这是OpenMP3.0中最激动人心的一个新特性。本文的”术语“大多数是根据个人理解用词,不保证用词准确性。(1)task基础OpenMP Tutorials: 任务构造https://computing.llnl.gov/tutorials/openMP/#Task从功能上说:1. The TASK construc

2011-11-23 23:22:23 8901 2

原创 OpenMP中omp_set_nested()和OMP_NESTED环境变量详解

(1)类似于omp_set_dynamic(http://blog.csdn.net/gengshenghong/article/details/7003688),omp_set_nested()的参数实际是一个表示布尔的变量,可以覆盖OMP_NESTED的设置。(2)OpenMP的嵌套并行和默认设置omp_set_nested()用于设置是否允许OpenMP进行嵌套并行,默认的设置为fa

2011-11-23 15:16:26 4671

原创 OpenMP中omp_set_dynamic()和OMP_DYNAMIC环境变量详解

理解这部分内容之前,先要理解omp_get_num_threads()和omp_get_max_threads()的含义和区别,参考:http://blog.csdn.net/gengshenghong/article/details/7003110(1)OMP_DYNAMIC环境变量:取值为TRUE和FALSE,定义是否动态设定并行区域执行的线程,默认为false。根据MSDN的说明

2011-11-23 14:40:07 7109

原创 OpenMP中几个容易混淆的函数(线程数量/线程ID/线程最大数)以及并行区域线程数量的确定

说明:这部分内容比较基础,主要是分析几个容易混淆的OpenMP函数,加以理解。(1)并行区域数量的确定:在这里,先回顾一下OpenMP的parallel并行区域线程数量的确定,对于一个并行区域,有一个team的线程去执行,那么该分配多少个线程去执行呢?OpenMP的遇到parallel指令后创建的线程team的数量由如下过程决定:1. if子句的结果2. num

2011-11-23 10:56:55 55096 6

原创 OpenMP并行构造的schedule子句详解

schedule子句是专门为循环并行构造的时候使用的子句,只能用于循环并行构造(parallel for)中。根据OpenMP Spec(http://openmp.org/mp-documents/OpenMP3.1-CCard.pdf)可以知道:schedule的语法为:schedule(kind[, chunk_size])kind:• static: Iteration

2011-11-22 23:22:51 34636

原创 OpenMP中数据属性相关子句详解(3): reduction子句

reduction的作用:A private copy for each list variable is created for each thread. At the end of the reduction, the reduction variable is applied to all private copies of the shared variable, and the fina

2011-11-22 16:12:19 17975 5

原创 OpenMP中数据属性相关子句详解(2):shared/default/copyin/copyprivate子句的使用

(1) sharedshared子句可以用于声明一个或多个变量为共享变量。所谓的共享变量,是值在一个并行区域的team内的所有线程只拥有变量的一个内存地址,所有线程访问同一地址。所以,对于并行区域内的共享变量,需要考虑数据竞争条件,要防止竞争,需要增加对应的保护,这是程序员需要自行考虑的。下面的例子是一个求和的并行实现,使用共享变量,由于没有采取保护,会有数据竞争:#define

2011-11-22 14:29:39 10206 7

原创 OpenMP中数据属性相关子句详解(1):private/firstprivate/lastprivate/threadprivate之间的比较

private/firstprivate/lastprivate/threadprivate,首先要知道的是,它们分为两大类,一类是private/firstprivate/lastprivate子句,另一类是threadprivate,为指令。(PS:有些地方把threadprivate说成是子句,但是实际来讲,它是一个指令。)可以参考http://blog.csdn.net/gengshe

2011-11-22 11:11:56 26940 19

原创 Android NDK的开发环境搭建和基本使用

Android NDK的安装很简单,直接解压到某一个路径下即可,因为NDK其实核心是一个交叉编译的工具链。(所以这里并不包括如何安装SDK,我相信安装SDK和NDK都不是难题,之所以写这个,是为了更好的区分开SDK和NDK,两者并无本质必然的关系)。(1)Android NDK下载:http://developer.android.com/sdk/ndk/index.html(

2011-11-17 15:36:14 2207

原创 NDK使用过程中问题集合

(1)Linux上NDKr7无法运行的问题:在Linux(Ubuntu)上解压NDKr7后,运行ndk-build脚本进行编译,发现如下错误:#$NDK/ndk-build/opt/android-ndk-r7/prebuilt/linux-x86/bin/awk: 1: ELF: not found/opt/android-ndk-r7/prebuilt/linux-x86

2011-11-17 15:30:09 6745 3

原创 在Eclipse中配置NDK自动编译环境builders

对于NDK的编译,切换到目标目录下,运行ndk-build脚本即可。对于使用Eclipse开发,我们希望EC能自动的编译我们的NDK,那么只需要为工程添加一个Builders即可。对于Windows的开发,如果使用的NDK是r7之前的版本,必须要安装Cygwin才能使用NDK,所以为EC需要配置的builder,其实是执行Cygwin,然后传递ndk-build作为参数。在NDKr7开始,

2011-11-17 14:31:07 27395 8

原创 Android NDK介绍

NDK是native development kit的含义,从含义很容易理解,本地开发。一般人都知道,Android开发语言是Java,同时,我们也知道,android是基于Linux的,其核心库很多都是C/C++的,比如其webkit等。那么NDK的作用,就是Google为了提供给开发者一个在Java中调用C/C++代码的一个工具。NDK本身其实就是一个交叉工具链,包含了android上的一些库

2011-11-17 14:07:58 2053

原创 MS编译器基本选项

Summary:记录一些MS编译器的常用选项,容易被忽略的选项,方便查询!MS Compiler OptionsTo Look Up Options:http://msdn.microsoft.com/zh-cn/library/9s7c9wdw(v=VS.100).aspx MS Compiler:            cl.exeMS Linker:

2011-11-16 22:03:06 1642

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除