ThreeWayBranch 优化阅读笔记

llongint

已于 2024-03-11 16:38:30 修改

阅读量309

点赞数 3

分类专栏：编译器文章标签：编译器

于 2024-03-11 15:54:32 首次发布

本文链接：https://blog.csdn.net/qq_36337149/article/details/136626091

版权

编译器专栏收录该内容

16 篇文章 1 订阅

订阅专栏

1. 优化目的

通过重排三分支的 BB 块减少比较指令的执行次数

代码路径:

bolt/lib/Passes/ThreeWayBranch.cpp

2. 效果

优化前：
注：黄色数字表示BB块编号，紫色表示该分支跳转的次数，绿色是代码里BB块的变量名
在这里插入图片描述

ThreeWayBranch 优化后:
在这里插入图片描述

注: BB块1.5 会在后面的优化删除
ThreeWayBranch + reorder-block 优化后:
在这里插入图片描述

测试用例：
bolt/test/runtime/X86/three-way-branch-pass.s

    .text
    .globl main
    .type main, %function
    .size main, .Lend-main
main:
    mov $0x0, %eax
    cmp $0x1, %eax
    jge .BB1
    mov $0xf, %eax
    xor %eax, %eax
    retq
.BB1:
    jg .BB2
    retq
.BB2:
    mov $0x7, %eax
    retq
.Lend:

遗留问题:
优化后的 BB 5 跳转变成 fallthrough 性能会更好吗 ?