python 脚本调用 google dictionary

最新推荐文章于 2024-03-18 14:23:56 发布

shrek222

最新推荐文章于 2024-03-18 14:23:56 发布

阅读量108

点赞数

分类专栏： python 文章标签： Google 脚本 Python F#

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

网上有通过python来调用google translate的,不过结果不是很细，于是又写了个取词典的.
需要lxml支持, xpath来解析文档比原始的 SGMLParser 要舒服很多.


import urllib2
import urllib
from StringIO import StringIO
from lxml import etree

def grabData(queryWord):
    requestUrl="http://www.google.cn/dictionary?langpair=en|zh-CN&q=what&hl=zh-CN&aq=f"
    requestUrl=requestUrl.replace("what",queryWord)
    req=urllib2.Request(requestUrl)
    data=urllib2.urlopen(req).read()
    return data

def parseData(htmlStr):
    result=[]
    parser=etree.HTMLParser()
    tree=etree.parse(StringIO(htmlStr),parser)
    element=tree.xpath("//div[@class='dct-srch-rslt']/ul[@class='dfnt']/li")
    for item in element:
        result.append(item.findtext("h4"))
        for subitem in item.xpath("ol/li"):
            detailItems=subitem.find("ul") #multi item
            if detailItems:
                result.append(subitem.findtext("span").replace("\n",""))
            else :
                detailItems=subitem

            ex=""
            for textElement in detailItems.iter():
                if textElement.text:
                    ex=ex+str(textElement.text)
            result.append(ex.replace("\n",""))
    return result

if __name__ == "__main__":
    content=parseData(grabData("love"))
    for line in content:
        print line

shrek222

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 脚本调用 google dictionary

网上有通过python来调用google translate的,不过结果不是很细，于是又写了个取词典的.需要lxml支持, xpath来解析文档比原始的 SGMLParser 要舒服很多.[code="java"]import urllib2import urllibfrom StringIO import StringIOfrom lxml import etree...
复制链接

扫一扫