曾经有个想法,是否可以通过抓取英语新闻,来做一个国人看得懂的国际新闻资讯APP,如今闲暇之余,实现了。
简单而快乐。
现贴出代码分享给你们,做个参考
import io
import sys
import urllib.request
from lxml import etree
from googletrans import Translator
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码
url = '外文网页'
res = urllib.request.urlopen(url)
htmlBytes=res.read()
html = htmlBytes.decode('utf-8')
tree = etree.HTML(html)
title = tree.xpath('//h1[@class="post__title"]/a/text()') # 获取标题
result = tree.xpath('//article[@class="post__article "]//text()') # 获取内容
# 内容提取,按照英文句号
content = []
str = ''
for x in result:
str += x;
if '.' in x:
content.append(str)
str=''
pass
translator = Translator(service_urls=[
'translate.google.cn'
],timeout=None)
res = translator.translate(content,dest='zh-cn',src='en')
# 输出翻译好的中文
for i in res: print(i.text)
每天进步一点点,加油
---我是bingo,码路漫漫,且行且珍惜