使用简单方法爬取
请求的url的参数中重要的有四个:
1 q:要播放的译文
2 tl:目标语言代码,la为拉丁语,其他语言代码可以通过查看google翻译的请求得到
3 textlen:请求的译文长度,包括空格
4 tk:token,这里用从另一篇文章中看到的方法来获取,通过PyExecjs来运行google翻译页面上产生token的方法
#author:CYTTT
import requests
import os
from getTk import ctx
myfile= open("拉丁词典.txt","r",encoding="utf-8")
wordlist=myfile.read().splitlines()
myfile.close()
log=open("log.txt","a",encoding="utf-8")
for word in wordlist:
if(os.path.exists("mp3/"+word+".mp3")):
continue
word2=word
if " " in word:
word2=word.replace("%20"," ")
url="https://translate.google.cn/translate_tts?ie=UTF-8&q="+word2+"&tl=la&total=1&idx=0&textlen="+str(len(word))+"&tk="+ctx.call("TL"