发现马来朋友使用的英英在线词典比较好用,于是想做一个英英词典的小程序。程序的实现主要包括两部分,1是完成在网页上有效信息的提取,2是python的界面开发。爬虫部分代码很简单。但到了界面部分开发时遇到了一些小问题。为了让英文解释的展示看上去更漂亮一些。需要在使用tkInter的Text控件进行展示时做如下工作:
(1)传入一个长度很长的string类型变量,不同行需要插入换行符
(2)导入Text()后需要有逐行识别该行类型的功能,该行的类型是词典名称、同义词展示还是单词解释?这个 应该很简单,词典名称用等于号来识别,同义词固定空多个空格,这样三种就可以识别了
(3)区分了不同的类型后,需要针对该行进行字体的调整, 这部分百度了好久,才知道答案
使用addtag(tagName,第一个字符位置,最后一个字符位置)函数来定义一个标签名称,而后tag_config(tgName, foreground=‘green4’,font=tkFont.Font(family=‘Courier New Baltic’, size=12, weight=tkFont.NORMAL))来定义具体的字体和字体颜色,字体的所有颜色的引用方法在此链接中查看http://www.science.smith.edu/dftwiki/index.php/Color_Charts_for_TKinter
效果如下:
具体代码如下:
import requests,bs4
import urllib
from tkinter import *
import tkinter.font as tkFont
class YouDaoFanyi(object):
def __init__(self):
pass
def crawl(self,word):
url = 'https://www.definitions.net/definition/' + str(word)
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36'
}
res = requests.get(url,headers=headers)
body=bs4.BeautifulSoup(res.text,'html.parser')
dicts=body.find(id='definitions-list').find_all('div',class_='rc5')
dictText=''
for i in dicts: