以下测试是针对媒体文件为14Kb
标准文件数据是50.3M时:
命中范围 | 代码类别 | 时间<s> | 文件大小<Byte> | 加速比 |
1-1 | CPU | 79.25 | 51812432 |
|
GPU | 5.47 | 51812432 | 14.49 | |
2-2 | CPU | 33.49 | 52774192 |
|
GPU | 5.388 | 52774192 | 6.22 |
标准文件数据是2.36G时:
命中范围 | 代码类别 | 时间<s> | 文件大小<Byte> | 加速比 |
3-7 | CPU | 327.781 | 2533582080 |
|
GPU | 274.856 | 2533582080 | 1.19 | |
1-10 | CPU | 293.308 | 2533883136 |
|
GPU | 266.117 | 2533883136 | 1.1 | |
1-4 | CPU | 427.298 | 2533883136 |
|
GPU | 288.251 | 2533883136 | 1.48 | |
1-3 | CPU | 667.752 | 2533883136 |
|
GPU | 256.880 | 2533883136 | 2.60 | |
2-3 | CPU | 664.551 | 2533860864 |
|
GPU | 277.435 | 2533860864 | 2.40 | |
4-9 | CPU | 306.975 | 2531334144 |
|
GPU | 274.408 | 2531334144 | 1.12 |
标准文件数据是23.6G时:
命中范围2-3 | 时间<s> | 文件大小<B> | 加速比 |
CPU | 6628.459 | 25338608640 |
|
GPU | 2275.211 | 25338608640 | 2.91 |
命中范围1-10 | 时间<s> | 文件大小<B> | 加速比 |
CPU | 2376.217 | 25338831360 |
|
GPU | 2286.331 | 25338831360 | 1.04 |
可以看见,使用cuda并没有加速很多,这是因为,GPU计算卡的优势在于浮点运算,而这套程序的需求只是单纯的做了字符的逻辑对比,并不能发挥GPU的优势。