这次升级了一下上次的xjb搞爬虫
因为这次学会用BS处理标签了,在查看了网站源代码之后发现不过如此,我也能搞!
然后就搞了一个,目前该爬虫支持简单的短语翻译(必须很简单才行,而且最好不要超过三个词)和所有的单词搜索(至少目前没有遇到搜不出来的),关于短语/短文的翻译,后面再做更新,感觉应该不难,还可以继续实现多种语言翻译,慢慢来
现在效果是这样子的,还能告诉你是什么词性,嘻嘻,主要是页面简洁操作简单,而且我个人也不是很喜欢查单词的时候再去打开浏览器搜索,这样emmmmm真挺好
挂下非常简单的源代码供参考交流哦
import requests
from bs4 import BeautifulSoup
import bs4
url1 = "http://www.youdao.com/w/"
url2 = "/#keyfrom=dict2.top"
kv = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:31.0) Gecko/20100101 Firefox/31.0' }
while 1:
print("\n")
print("请输入想翻译的内容:")
url = input()
r = requests.get(url1 + url + url2, headers = kv)
text = r.text
soup = BeautifulSoup(text, "html.parser")
for word in soup.find('div', id = "phrsListTab").children:
if isinstance(word, bs4.element.Tag):
tds = word('li')
if(tds):
for i in range(len(tds)):
print(tds[i].contents[0])