导读
上一篇文章写了如何爬取《The Atlantic》的新闻学习英语,这篇文章补充上一篇文章,在爬取文章段落时,同时调用翻译接口,到达如图所示的样子。
如图,翻译的非常不错,借助的是彩云小译·程序猿都知道的翻译机。以下重点就是讲解如何抓包,使用彩云小译的第三方API
问题 文章收纳
写入文件
这里是直接写入markdown,并添加了translate()函数翻译,其余内容可参考上一篇文章
def to_MarkDown(header,meta,time,p_list):
with open('./《Atlantic》__{}.md'.format(header[0].strip()),'w+',encoding='utf=8') as f:
f.writelines('## {}'.format(header[0].strip())+'\n')
f.writelines('**{}**'.format(time[0].strip())+'爬取自《The Atlantic》\n\n')
f.writelines('> 导读:**{}**'.format(meta[0].strip())+'\n\n')
f.write('\n ')
# for p in p_list:
# f.write('\n\n '.join(p))
# f.write('\n\n ')
source = []
for p in p_list:
for i in p:
source.append(i)
p_trans = translate(source)
for i , j in zip(source,p_trans):
f