1.
这两天在移植libhugetlbfs到2.6.36 for Loogson上,移植完成后需要测试linpack在大页面支持下的性能。但是却发现大页面对linpack无效,linpack死活不利用大页面。怎么回事?莫非linpack使用mmap接口分配内存?怎么这样呢~!
于是今天分析了linpack源码,结果发现它里面的内存分配都是用malloc实现的。那为什么大页面支持会对其无效呢?
刚才做了个试验,分别将一个应用按照static模式 和普通模式 编译,然后用大页面支持他们,测试结果表明:
static模式下,应用内部的malloc函数不能被大页面库截获,大页面没有被利用。
普通模式下,应用内部的malloc函数能够被大页面库截获,大页面被利用。
所以我认为:hpl(high performance Linpack)程序在编译时采用了static选项,导致无法用大页面对其进行支持。需要得到hpl的源码,去掉static选 项,重新编译即可。
科普:
1. LD_PRELOAD的原理就是截取对函数库的调用,使用static后,库函数被内联到了应用中,LD_PRELOAD没有了任何可乘之机。
2. gcc static 编译选项: http://blog.19lou.com/10061845/viewspace-384095
3. 大页面: http://www.ibm.com/developerworks/cn/linux/l-cn-hugetlb/index.html
2.
gcc 在编译时如何去寻找所需要的头文件 :
※header file的搜寻会从-I开始
※然后找gcc的环境变量 C_INCLUDE_PATH,CPLUS_INCLUDE_PATH,OBJC_INCLUDE_PATH
※再找内定目录
/usr/include
/usr/local/include