以矩阵乘法为例了解cpu cache对程序性能的影响

最新推荐文章于 2024-06-22 09:51:05 发布

浩铭888

最新推荐文章于 2024-06-22 09:51:05 发布

阅读量841

点赞数

      
      
       
       /*square1.cpp*/
      
      
      
      
       
       /*未经优化的矩阵乘法程序*/
      
      
      
      
       
       #include <iostream>
      
      
      
      
       
       using 
       
       namespace 
       
       std
       
       ;
      
      
      
      
       
       #define N 1000
      
      
      
      
       
       int 
       
       a
       
       [
       
       N
       
       ][
       
       N
       
       ] 
       
       = 
       
       {
       
       0
       
       }, 
       
       b
       
       [
       
       N
       
       ][
       
       N
       
       ] 
       
       = 
       
       {
       
       0
       
       }, 
       
       c
       
       [
       
       N
       
       ][
       
       N
       
       ] 
       
       = 
       
       {
       
       0
       
       };
      
      
      
      
       
       int 
       
       main
       
       () 
       
       {
      
      
      
          
       
       int 
       
       i
       
       , 
       
       j
       
       , 
       
       k
       
       ;
      
      
      
          
       
       for 
       
       (
       
       i 
       
       = 
       
       0
       
       ; 
       
       i 
       
       < 
       
       N
       
       ; 
       
       i
       
       ++
       
       ) 
       
       {
      
      
      
              
       
       for 
       
       (
       
       j 
       
       = 
       
       0
       
       ; 
       
       j 
       
       < 
       
       N
       
       ; 
       
       j
       
       ++
       
       ) 
       
       {
      
      
      
                  
       
       a
       
       [
       
       i
       
       ][
       
       j
       
       ] 
       
       = 
       
       i
       
       +
       
       j
       
       ;
      
      
      
                  
       
       b
       
       [
       
       i
       
       ][
       
       j
       
       ] 
       
       = 
       
       i
       
       +
       
       j
       
       ;
      
      
      
              
       
       }
      
      
      
          
       
       }
      
      
      
          
       
       for 
       
       (
       
       i 
       
       = 
       
       0
       
       ; 
       
       i 
       
       < 
       
       N
       
       ; 
       
       i
       
       ++
       
       ) 
       
       {
      
      
      
              
       
       for 
       
       (
       
       j 
       
       = 
       
       0
       
       ; 
       
       j 
       
       < 
       
       N
       
       ; 
       
       j
       
       ++
       
       ) 
       
       {
      
      
      
                  
       
       for 
       
       (
       
       k 
       
       = 
       
       0
       
       ; 
       
       k 
       
       < 
       
       N
       
       ; 
       
       k
       
       ++
       
       ) 
       
       {
      
      
      
                      
       
       c
       
       [
       
       i
       
       ][
       
       j
       
       ] 
       
       += 
       
       a
       
       [
       
       i
       
       ][
       
       k
       
       ] 
       
       * 
       
       b
       
       [
       
       k
       
       ][
       
       j
       
       ];
      
      
      
                  
       
       }
      
      
      
      

      
      
      
              
       
       }
      
      
      
          
       
       }
      
      
      
      
       
       }

来自CODE的代码片
square1.cpp

 
        1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23 
           
             /*square2.cpp*/  
            
             /*优化过的矩阵乘法程序*/  
            
             #include <iostream>  
            
             using 
             
             namespace 
             
             std
             
             ;  
            
             #define N 1000  
            
             int 
             
             a
             
             [
             
             N
             
             ][
             
             N
             
             ] 
             
             = 
             
             {
             
             0
             
             }, 
             
             b
             
             [
             
             N
             
             ][
             
             N
             
             ] 
             
             = 
             
             {
             
             0
             
             }, 
             
             c
             
             [
             
             N
             
             ][
             
             N
             
             ] 
             
             = 
             
             {
             
             0
             
             };  
            
             int 
             
             main
             
             () 
             
             {  
            
             int 
             
             i
             
             , 
             
             j
             
             , 
             
             k
             
             ;  
            
             for 
             
             (
             
             i 
             
             = 
             
             0
             
             ; 
             
             i 
             
             < 
             
             N
             
             ; 
             
             i
             
             ++
             
             ) 
             
             {  
            
             for 
             
             (
             
             j 
             
             = 
             
             0
             
             ; 
             
             j 
             
             < 
             
             N
             
             ; 
             
             j
             
             ++
             
             ) 
             
             {  
            
             a
             
             [
             
             i
             
             ][
             
             j
             
             ] 
             
             = 
             
             i
             
             +
             
             j
             
             ;  
            
             b
             
             [
             
             i
             
             ][
             
             j
             
             ] 
             
             = 
             
             i
             
             +
             
             j
             
             ;  
            
             }  
            
             }  
            
             for 
             
             (
             
             i 
             
             = 
             
             0
             
             ; 
             
             i 
             
             < 
             
             N
             
             ; 
             
             i
             
             ++
             
             ) 
             
             {  
            
             for 
             
             (
             
             k 
             
             = 
             
             0
             
             ; 
             
             k 
             
             < 
             
             N
             
             ; 
             
             k
             
             ++
             
             ) 
             
             {  
            
             for 
             
             (
             
             j 
             
             = 
             
             0
             
             ; 
             
             j 
             
             < 
             
             N
             
             ; 
             
             j
             
             ++
             
             ) 
             
             {  
            
             c
             
             [
             
             i
             
             ][
             
             j
             
             ] 
             
             += 
             
             a
             
             [
             
             i
             
             ][
             
             k
             
             ] 
             
             * 
             
             b
             
             [
             
             k
             
             ][
             
             j
             
             ];  
            
             }  
            
             }  
            
             }  
            
             }