链接导航
如果大家对安装等基本操作有疑问的话可以参考我写的一篇JOERN基本使用介绍
JOERN基本使用介绍
1 解析前的准备
joern
在解析C/C++
代码时,输入形式是一个独立的文件夹,每个文件夹包含着要解析的.cpp
文件,具体如下:
每一个文件夹的内容都只包含一个独立的.cpp
文件
也就是说:我有一个很大的数据集,里面是很多的C++
代码段,我需要先把这些C++
代码段包装成一个个独立的.cpp
代码文件,然后再使用与.cpp
文件数量相等的文件夹来包裹住每一个独立的.cpp
文件,即每个文件夹里面只有一个.cpp
文件。
我的文件目录结构为:
data
data/c_code
data/c_code/dirs
data/c_code/dirs/1-29500
data/c_code/dirs/1-29500/1-29500.zpp
输入到joern中的是data/c_code/dirs/1-29500
调用joern批量生成cpg的.dot文件
import subprocess
import os
import shutil
import pandas as pd
from tqdm import tqdm
# path-to-joern-parse
JOERNPATH="/home/se/joern-cli/"
root_dir = './data/'
# location of source code dirs
source_dir = "./data/c_code/dirs"
parse_source_code_to_dot函数
输入要解析的文件夹, 文件名称
输出解析好的dot文件并存储到指定文件夹中(out_dir_pdg/out_dir_cpg)