@nhahtdh提出的答案是有效的,但是我比那些使用比正则表达式操作更不透明的代码,并利用python的内置数据结构和匿名函数功能的规范例子来说,它的争论比较少。
import re
def multiple_replace(dict, text):
# Create a regular expression from the dictionary keys
regex = re.compile("(%s)" % "|".join(map(re.escape, dict.keys())))
# For each match, look-up corresponding value in dictionary
return regex.sub(lambda mo: dict[mo.string[mo.start():mo.end()]], text)
if __name__ == "__main__":
text = "Larry Wall is the creator of Perl"
dict = {
"Larry Wall" : "Guido van Rossum",
"creator" : "Benevolent Dictator for Life",
"Perl" : "Python",
}
print multiple_replace(dict, text)
所以在你的情况下,你可以使一个dict trans = {“a”:“aa”,“b”:“bb”},然后将其传递到multiple_replace以及要翻译的文本。基本上所有这些功能正在创建一个包含所有正则表达式进行翻译的巨型正则表达式,然后当找到一个正则表达式时,将lambda函数传递给regex.sub来执行翻译字典查找。
您可以在从文件中读取时使用此功能,例如:
with open("notes.txt") as text:
new_text = multiple_replace(replacements, text.read())
with open("notes2.txt", "w") as result:
result.write(new_text)
我实际上在生产中使用了这种确切的方法,在这种情况下,我需要将捷克语中的几个月翻译成英文,以进行网络抓取任务。
正如@nhahtdh所指出的那样,这种方法的一个缺点是它不是前缀:字典键是其他字典键的前缀将导致该方法中断。