在上一篇文章中,我提到要将中文三元组拆开成实体1-联系-实体2一共三个文件,分别进行翻译,现在翻译结束后,需要将三个文件按顺序再合成翻译好的三元组。
代码如下:
with open('实体1.txt', 'r', encoding = 'utf-8') as f1, open('联系.txt', 'r', encoding = 'utf-8') as f2, open('实体2.txt', 'r', encoding = 'utf-8') as f3, open('合成新三元组.txt', 'w', encoding = 'utf-8') as newfile:
for line1, line2, line3 in zip(f1, f2, f3):
new_line = line1.strip() + '*' + line2.strip() + '*' + line3.strip() + '\n'
newfile.write(new_line)
实体1:
联系:
实体2:
运行代码将其合成,分隔符使用了“*”,合成后效果如下: