关于将网易有道词典单词本导出到必应词典生词本的尝试

       一直以来用有道词典系列,但是目前该软件WP版本无背单词功能。细想想,有道笔记和有道词典在WP上都很一般,想来网易认为既然微软开发必应词典,那么自家在WP花大力气也不值得,企业行为可以理解。发现必应词典这方面做得挺好,于是想把有道的单词本导出到必应词典。明显必应的功能设计更合理,可以给单词做笔记。

       折腾半天,没有完全成功,但是在少量单词的情况下还是可以的。笔记一下,留着下回继续。

  1.        首先将有道词典单词本导出为Y.xml,接着也将必应词典单词本导出为B.xml。
  2.        然后参考用excel分别打开上述文件,将Y.xml的字段分别放入B.xml中,注意需要用一般的“黏贴”,不要用“仅复制值”。
  3.       需要说明的是,必应词典的导入程序不能缺少任何一个字段值。一个典型的必应的xml如下,例如Note字段为空,必须为<Note />而不可以是<Note></Note>此处鄙视一下M$。Eng字段表单词,Phonetic音标,Defi释义,Date收藏日期,Note备注
  4. <?xml version="1.0"?>
    <FCVocaPhraseList xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
      <Phrases>
        <Phrase>
          <Eng>melancholy</Eng>
          <Phonetic>['mel蓹nk蓹li]</Phonetic>
          <Defi>adj. 蹇ч儊鐨勶紱浣夸汉鎮蹭激鐨?/Defi>
          <Date>2014-12-28 10:16:11</Date>
          <Note>comment</Note>
        </Phrase>
        <Phrase>
          <Eng>baronet</Eng>
          <Phonetic>['b忙r蓹nit]</Phonetic>
          <Defi>n. 浠庣敺鐖碉紱鍑嗙敺鐖?/Defi>
          <Date>2014-12-28 10:16:11</Date>
          <Note />
        </Phrase>
        <Phrase>
          <Eng>paralyse</Eng>
          <Phonetic>['p忙r蓹laiz]</Phonetic>
          <Defi>vt. 浣库€︹€︽棤鍔涳紱浣库€︹€﹂夯鐥癸紱浣库€︹€︾槴鐥?/Defi>
          <Date>2014-12-28 10:16:11</Date>
          <Note />
        </Phrase>
        <Phrase>
          <Eng>forlorn</Eng>
          <Phonetic>[f蓹'l蓴藧n]</Phonetic>
          <Defi>adj. 琚仐寮冪殑锛涚粷鏈涚殑锛涘鐙殑</Defi>
          <Date>2014-12-28 10:16:11</Date>
          <Note />
        </Phrase>
      </Phrases>
    </FCVocaPhraseList>
  5. 上一步最好要保证Y.xml的字段值全部都有内容,即用excel把y.xml中的任何音标或释义的条目都删除,剩下的收藏日期复制,一个典型的有道导出文件如下:
  6. <wordbook><item>    <word>melancholy</word>
        <trans><![CDATA[adj. 蹇ч儊鐨勶紱浣夸汉鎮蹭激鐨刔]></trans>
        <phonetic><![CDATA[['mel蓹nk蓹li]]]></phonetic>
        <tags>LadyChatterley</tags>
        <progress>3</progress>
    </item><item>    <word>baronet</word>
        <trans><![CDATA[n. 浠庣敺鐖碉紱鍑嗙敺鐖礭]></trans>
        <phonetic><![CDATA[['b忙r蓹nit]]]></phonetic>
        <tags>LadyChatterley</tags>
        <progress>7</progress>
        </item>
    </wordbook>

item条目,word单词,trans翻译,phonetic音标,tags分类,progress表示背诵进度,背成功了几遍

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
以下是对网易有道词典单词本进行爬虫并存入Excel的Python代码: ```python import requests from bs4 import BeautifulSoup import openpyxl # 定义爬虫函数 def spider(url): # 发送请求 response = requests.get(url) # 解析HTML soup = BeautifulSoup(response.content, 'html.parser') # 获取单词 words = soup.select('.wordbook-wordlist .wordbook-word-item .wordbook-word')[1:] # 获取词性和释义 meanings = soup.select('.wordbook-wordlist .wordbook-word-item .wordbook-word-item-meanings')[1:] # 存储单词及其词性和释义 wordbook = [] for i in range(len(words)): word = words[i].get_text().strip() meaning = meanings[i].get_text().strip() wordbook.append([word, meaning]) return wordbook # 定义保存到Excel函数 def save_to_excel(wordbook, filename): # 创建Excel文件 workbook = openpyxl.Workbook() # 获取第一个sheet sheet = workbook.active # 写入表头 sheet.cell(row=1, column=1, value='单词') sheet.cell(row=1, column=2, value='词性和释义') # 写入单词及其词性和释义 for i in range(len(wordbook)): word = wordbook[i][0] meaning = wordbook[i][1] sheet.cell(row=i+2, column=1, value=word) sheet.cell(row=i+2, column=2, value=meaning) # 保存Excel文件 workbook.save(filename) # 测试代码 if __name__ == '__main__': wordbook_url = 'http://dict.youdao.com/wordbook/wordlist' response = requests.get(wordbook_url) soup = BeautifulSoup(response.content, 'html.parser') # 获取单词本链接 wordbook_links = soup.select('.wordbook-wrap .wordbook-title .wordbook-title-name a') for link in wordbook_links: href = link['href'] title = link.get_text().strip() # 爬取单词本 wordbook = spider(href) # 保存到Excel save_to_excel(wordbook, f'{title}.xlsx') ``` 这段代码将爬取网易有道词典单词本页面中的单词及其对应的词性和释义,然后将其保存到Excel文件中。使用时,将代码复制到Python文件中,修改`wordbook_url`为单词本页面的链接,然后运行脚本即可。注意要安装所需的库,如`requests`、`beautifulsoup4`和`openpyxl`等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值