我正在做各种Linux发行版的执行分析。
除非你非常小心你正在做什么,否则你不可能以有意义的方式发现内核版本和分发之间微妙的性能差异。从正在运行的程序级别来看,发行版之间几乎没有什么区别,除了它们使用的Linux内核版本。
2)高内存利用率
你的程序需要的malloc()一堆记忆 - 然后写入。一些Linux发行版默认为overcommit memory。只需调用malloc()创建一个数组并写入每个元素就足够了。
3)高IO利用率
考虑使用fio,而不是在这里写你自己的代码。如果您确实需要编写自己的代码,那么您需要确定几件事情:
随机或顺序IO?这对于固态硬盘来说并不重要,但在磁性驱动器上,这两种情况下的性能特性有很大不同。
读取或写入?不同的存储子系统的读写操作可能会有很大不同。
直接IO或缓冲IO?您是想强调整个端到端IO子系统,还是仅仅是底层存储。像O_DIRECT和O_SYNC这样的标志实质上改变了内核处理IO的方式。
文件系统IO或块IO?您是否有兴趣通过创建和删除文件来测试文件系统的性能,还是仅对块文件执行IO操作?
这里最简单的代码是使用open()创建一个大文件,然后使用rand()与pread()和pwrite()一起在该文件中执行随机块IO。如果你想测试文件系统,你需要多次调用open()和unlink()。
IO标杆是一个非常微妙的话题,这就是为什么我会鼓励你坚持使用像fio一个很好理解的工具。
4)高CPU IO等待
与你的CPU代码,就导致高IO等待你的组合IO装载机。如果你强调任何IO子系统,你会得到IO等待。