文章发表在ISCA‘09上的,顶级会议的文章,非常6。作者提出了一种估算GPU程序运行时间的模型(建模),在MWP和CWP[1]的基础上推导出程序执行的指令数CPI进而预测出时间。具体的推导公式没细看(略多略复杂),总体感觉文章的目的(预测程序执行时间)不是重点,而且作者建模过程中提出的一些细节很值得借鉴。如果以后遇到相关问题可以再翻出来仔细读读。
参考:
[1] Hong S, Kim H. An analytical model for a GPU architecture with memory-level and thread-level parallelism awareness[C]//ACM SIGARCH Computer Architecture News. ACM, 2009, 37(3): 152-163.