根据单词列表通过网络下载单词发音

最新推荐文章于 2019-11-18 20:00:42 发布

weixin_33595571

最新推荐文章于 2019-11-18 20:00:42 发布

阅读量785

点赞数

分类专栏：代码 python

本文链接：https://blog.csdn.net/weixin_33595571/article/details/91356147

版权

代码同时被 2 个专栏收录

309 篇文章 5 订阅

订阅专栏

python

83 篇文章 2 订阅

订阅专栏

# -*- coding: utf-8 -*-
"""
Created on Sun Jun  9 18:02:11 2019
QQ群：476842922(欢迎加群讨论学习)
@author: Administrator
"""
import urllib.request
from lxml import etree
import re 
import time
from functools import reduce

#获得页面数据
def get_page(myword):
    basurl='http://cn.bing.com/dict/search?q='
    searchurl=basurl+myword
    response =  urllib.request.urlopen(searchurl)  
    html = response.read()
    return html

#获得单词释义
def get_chitiao(html_selector):
    chitiao=[]
    hanyi_xpath='/html/body/div[1]/div/div/div[1]/div[1]/ul/li'
    get_hanyi=html_selector.xpath(hanyi_xpath)
    for item in get_hanyi:
        it=item.xpath('span')
        chitiao.append('%s||%s'%(it[0].text,it[1].xpath('span')[0].text))
    if len(chitiao)>0:
        return reduce(lambda x, y:"%s||||%s"%(x,y),chitiao)
    else:
        return ""

#获得单词音标和读音连接
def get_yingbiao(html_selector):
    yingbiao=[]
    yingbiao_xpath='/html/body/div[1]/div/div/div[1]/div[1]/div[1]/div[2]/div'
    bbb="(https\:.*?mp3)"
    reobj1=re.compile(bbb,re.I|re.M|re.S)
    get_yingbiao=html_selector.xpath(yingbiao_xpath)
    for item in get_yingbiao:
        it=item.xpath('div')
        if len(it)>0:
            ddd=reobj1.findall(it[1].xpath('a')[0].get('onmouseover',None))
            yingbiao.append("%s||%s"%(it[0].text,ddd[0]))
            ddd=reobj1.findall(it[3].xpath('a')[0].get('onmouseover',None))
            yingbiao.append("%s||%s"%(it[2].text,ddd[0]))
    if len(yingbiao)>0:
        return reduce(lambda x, y:"%s||||%s"%(x,y),yingbiao)
    else:
        return ""

#获得例句
def get_liju(html_selector):
    liju=[]
    get_liju_e=html_selector.xpath('//*[@class="val_ex"]')
    get_liju_cn=html_selector.xpath('//*[@class="bil_ex"]')
    get_len=len(get_liju_e)
    for i in range(get_len):
        liju.append("%s||%s"%(get_liju_e[i].text,get_liju_cn[i].text))
    if len(liju)>0:
        return reduce(lambda x, y:"%s||||%s"%(x,y),liju)
    else:
        return ""

def get_word(word):
    #获得页面
    pagehtml=get_page(word)
    selector = etree.HTML(pagehtml.decode('utf-8'))
    #单词释义
    chitiao=get_chitiao(selector)
    #单词音标及读音
    yingbiao=get_yingbiao(selector)
    print("YYYYYYYYYYYYYYYYYYYYYYYy")
    print(yingbiao)
    print("YYYYYYYYYYYYYYYYYYYYYYYy")
    #分割字符串||
    pronounce=yingbiao.split("||")
    print("find pronounce") 
    print(pronounce)
    print("find pronounce")
    print(pronounce[1])
    urllib.request.urlretrieve(pronounce[1],word+".mp3")
    #例句
    liju=get_liju(selector)
    return "%s\t%s\t%s\t%s"%(word,yingbiao,chitiao,liju)

filename='5.txt'
f=open(filename,"r")
words=f.readlines()
print("==================")
print(words)
print("==================")
f.close()
filename2='5_jieguo.txt'
f=open(filename2,"wb")
i=0
for word in words:
    print("wwwwwwwwww")
    print(word)
    print("wwwwwwwwww")
    time.sleep(0.2)
    #Python rstrip() 删除 string 字符串末尾的指定字符（默认为空格）
    print(word.rstrip(),i)
    word_line=get_word(word.rstrip())
    #f.write(word_line)    
    #f.write("%s\n"%(word_line.encode()))
    i=i+1
f.close()

在这里插入图片描述

weixin_33595571

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
根据单词列表通过网络下载单词发音

# -*- coding: utf-8 -*-"""Created on Sun Jun 9 18:02:11 2019QQ群：476842922(欢迎加群讨论学习)@author: Administrator"""import urllib.requestfrom lxml import etreeimport re import timefrom functools im...
复制链接

扫一扫