我正在尝试使用Python处理从.pdf中获取的文本。在
我尝试的方法之一是:找到特定的项目并打印同一行、前一行或后一行。在
但我没法理解这一点。在
下面的代码将使用“find”函数查找并打印当前行中的信息,但我需要能够使用它来打印后面和前面的行。在
被废弃的文本如下所示:Smith, John
Per End 12/12/12
File:
12345
我使用的代码是:def main():
file = open("Register.txt","r")
lines = file.readlines()
file.close
for line in lines:
line = line.strip()
countPerEnd = 0
countFile = 0
if line.find("Per End")!=-1:
countPerEnd = countPerEnd + 1
if line.find("File:")!=-1:
countFile = countFile + 1
print ("Per End: ", countPerEnd)
print ("File: ", countFile)
main()
我只能得到我必须打印的行,但需要他们能够罚款的其他项目,如在本例中的名称和编号后面的“文件:”。在
因为除了字符串“Per End”和“file:”之外,它可以是任何内容,所以总是相同的。在
我把结果打印出来看看结果如何。在
输出为:
每端:12/12/12
我需要的输出基于“每端”:
史密斯,约翰