程序分析：python提取文件中指定的代码行

最新推荐文章于 2023-03-29 15:31:57 发布

Messi-Q

最新推荐文章于 2023-03-29 15:31:57 发布

阅读量1.5k

点赞数 1

分类专栏： python 数据处理文章标签： python 数据处理

本文链接：https://blog.csdn.net/qq_34611579/article/details/87927059

版权

python 同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

数据处理

3 篇文章 0 订阅

订阅专栏

上一篇文章中提到对solidity源代码的注释和空格的处理；有时候做数据处理时只需要一些指定的代码行，一些对实验无用的代码应该去掉，这样有助于我们队数据进行分析。在我们所做的实验中，我需要提取的是和call.value这个关键字相关的代码段，这里我们先进行了一些初步的处理，提取call.value的前10行代码和后10行代码。

（1）定位文件中call.value的位置

def find_location(filepath):
    f = open(filepath, 'r')
    lines = f.readlines()
    f.close()
    line_len = len(lines)
    location = 0
    for i in range(line_len):
        if 'call.value' in lines[i]:
            location = i
    extract_selected_code(filepath, location)

对于一个文件，首先我们需要定位到call.value的位置，找到该位置之后，我们就可以提取该位置的前10行和后10行的代码了。

（2）提取指定的代码段

def extract_selected_code(filepath, location):
    f = open(filepath, 'r')
    lines = f.readlines()
    f.close()
    line_len = len(lines)
    result = None
    result1 = None
    result2 = None
    if location - 10 >= 0:
        result1 = lines[location - 10:location]
        print('前10行：', result1)
    else:
        result1 = lines[0:location]
        print('前10行：', result1)
    if location + 10 <= line_len:
        result2 = lines[location:location + 10]
        print('后10行：', result2)
    else:
        result2 = lines[location:line_len]
        print('后10行：', result2)
    result = result1 + result2
    print(result)
    newFilePath = '../train_data_V2/'
    writeResult(newFilePath + filepath.split('/')[2], result)

在这里我们进行了一些小的处理，如果call.value的关键字在最前面或最后面，那么直接运行会获取不到代码段；由此，我们在这里加入了基本的判断，见（2）。

完整的可运行的代码可见：https://github.com/Messi-Q/SmartContract-Detection-Based-DeepLearning/blob/master/tools/extract_related_code.py