最前
作为一名英语并不好的小白,近期苦于阅读英文文献,常常要用到机器翻译。然而,从PDF文件中复制内容,往往会出现多余的换行情况,强迫症患者表示这很难受,如下图所示:
并且这样多余的换行出现一定程度上影响了翻译的结果,也不利于中文阅读,影响看论文的速度,
解决方案
1. 利用Python将多余的换行去除掉
该功能参考了CSDN作者YLPGG的思路,使用时仅需复制需要翻译的内容到程序中,可复制多段文字,然后在内容后输入一个#(井字符号),再回车即可,代码如下:
def get_content():
'''
处理PDF文件复制后多余的换行
'''
print('请输入要翻译的内容:')
transText = ""
line = sys.stdin.readline()
while line != "#\n":
transText += line
line = sys.stdin.readline()
transText = transText.replace(".\n","段落")
transText