# All CopyRight Reserved by bomber@sjtu.edu.cn
#!/usr/bin/env python
# coding=utf8
import re,sys,urllib2
from bs4 import BeautifulSoup
def get_text(url):
req = urllib2.Request(url)
return urllib2.urlopen(req).read()
url = 'http://cn.bing.com/dict/search?q='
while True:
word = raw_input("Input:")
if 'q' == word:#按q退出。。
sys.exit(1)
#生成查询链接
w = url+word
#扔给必应吧。。。
text = get_text(w)
#准备用bs解析
soup = BeautifulSoup(text)
#定位到解释处
results = soup.find_all("span","def")
for result in results:
result = str(result)
#通过正则表达式抽取解释
result = re.sub(r'<span.*?<span>','', result)
result = re.sub(r'</span>','',result)
print result
其实就是一个wrapper,但是方便了很多,看论文的时候不用总是在浏览器间切换和删掉之前留在搜索栏里的单词。
有兴趣的可以做成图形界面的形式。