(Raw/High) P-Code Ghidra使用的中间表示语言

苏打呀

已于 2022-03-07 09:27:35 修改

阅读量2.9k

点赞数 4

文章标签：软件分析二进制分析 angr

于 2022-03-02 19:23:39 首次发布

本文链接：https://blog.csdn.net/weixin_49393427/article/details/123201539

版权

简介

P-code是一种专为逆向工程而设计的寄存器传输语言。该语言通用性强，可以对不同处理器的行为进行建模，将对不同处理器的分析放入一个通用框架中，促进retargetable的分析算法和应用开发。

P-code的工作原理是将单个处理器指令转换为一组p-code操作，这些操作将处理器状态的一部分作为输入和输出变量（varnodes），这组唯一的p-code操作（和opcode区分）包含一组相当紧凑的由通用处理器执行的算术和逻辑操作。将指令直接转换为这些操作称为raw p-code。raw p-code可用于直接模拟指令执行，并且通常遵循相同的控制流，尽管它可能会添加一些自己的内部控制流。

P-code专门设计用于方便地构建数据流图，以便对反汇编后的指令进行后续分析。Varnodes和p-code操作符可以显式地视为这些图中的节点。生成raw p-code是图构造中必要的第一步，但还需要执行其他步骤，这会引入一些新的操作符。特别地其中两个新操作符MULTIEQUAL和INDIRECT用于图的构建过程，其他操作符可以在图的后续分析和转换过程中引入，并帮助保持恢复数据类型关系。最后，一些p-code操作CALL、CALLIND、RETURN可能会在分析期间更改其输入和输出varnode，导致它们不再和raw p-code形式匹配。

Ghidra的初始程序分析生成的p-code和varnode是原始（raw）的，因为仅用于表示指令的语义，很少或没有从高级语言中分析收集到的高级语义信息。Ghidra在反编译期间，p-code和varnodes被refined和关联到抽象的局部变量和源码级别的数据结构，称之为high p-code，因为它与 Ghidra中包含反编译信息的数据结构绑定，例如HighVariables和HighFunctions。

Ghidra默认情况下显示的p-code可读性较好：
在这里插入图片描述
然而在script中获取和处理的时候是未经翻译的原始形式，显示raw p-code的方法：Edit - Tool Options - Listing Fields - Pcode Field - Display Raw Pcode，例子：

high p-code举例（script时应该叫PcodeOpAST）：

(register, 0x20, 4) CALL (ram, 0x13438, 8) , (unique, 0x10000051, 4) , (const, 0x0, 4)
(

最低0.47元/天解锁文章