在网上浩如烟海的工具和代码中选择这个,然后并不能直接用,需要添加代理:
from google_trans_new import google_translator
proxy = {"https":"http://xxxx"}
translator = google_translator(proxies=proxy)
translate_text = translator.translate(['xx'], 'zh')
print(translate_text)
然后按照这里修复源码,即可成功。
另外记录下缅甸语分词工具、缅甸语词典网站。
该网站如果要爬虫,使用xpath就可以。但是会反爬,一小时一个ip只能500条,否则会ban。近期发现的问题是实验室的代理有点问题,即偶尔不能加载出页面,五个词汇只有三个或两个能加载。使用我的ip,持续爬407条数据就会遇到反爬,需要人工验证,但是不会被ban,而实验室代理没有这问题,还需解决。