LLVM实战之C源码编译

本文详细介绍了如何使用Clang工具将C语言源码转换为LLVM中间表示(IntermediateRepresentation),包括编译步骤、工作原理,重点涉及词法分析、语法分析和抽象语法树的构建过程。
摘要由CSDN通过智能技术生成

目录

1. 详细步骤

2. 工作原理


      本文将展示使用Clang(C语言前端),把C语言源码转换成LLVM IR 。当然首先需要安装Clang并且把它添加到PATH环境中。

1. 详细步骤

(1)首先准备测试文件,在multiply.c文件编写一段C代码,如下:

$ cat multiply.c
int mult() {

  int a =5;

  int b = 3;

  int c = a * b;

  return c;

}

(2)使用Clang工具将C语言转换成LLVM IR,命令如下:

$ clang -emit-llvm -S multiply.c -o multiply.ll

其中参数:

-emit-llvm:使用LLVM表示汇编和目标文件

-S: 使用.ll文件输出,不加-S,输出文件是.bc格式

(3)查看生成的LLVM IR

$ cat multiply.ll
; ModuleID = 'multiply.c'

target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"

target triple = "x86_64-unknown-linux-gnu"

; Function Attrs: nounwind uwtable

define i32 @mult() #0 {

  %a = alloca i32, align 4

  %b = alloca i32, align 4

  %c = alloca i32, align 4

  store i32 5, i32* %a, align 4

  store i32 3, i32* %b, align 4

  %1 = load i32* %a, align 4

  %2 = load i32* %b, align 4

  %3 = mul nsw i32 %1, %2

  store i32 %3, i32* %c, align 4

  %4 = load i32* %c, align 4

  ret i32 %4

}

2. 工作原理

      将C语言代码编译为LLVM IR的过程从词法分析开始——将C语言源码分解成token流,每个token可表示标识符、字面量、运算符等;token流会传递给语法分析器,语法分析器会在语言的CFG(Context Free Grammar,上下文无关文法)的指导下将token流组织成AST(抽象语法树);接下来会进行语义分析,检查语义正确性,然后生成IR。

后续会有文章详细描述词法分析、语法分析和代码生成的工作原理。

  • 5
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值