Python编程快速上手》看的太快了,好多基础没彻底掌握,写这个小玩意就当复习巩固一下。开始的时候想着用 string.isalpha() 来判断英文,加入列表,结果不知道为什么中文也进去了。 接着开始写函数来判断,结果........文本里有各种标点,空格,括号,一同瞎忙乎,没啥鸟用。 最后发现还是regex最牛逼,直接全提取出来了。 不过还是收获满满,虽然做了好多无用功,但是对这些基础的更了解了。收获远远大于预期写出来。
用途:
将百度搜索到到英语词汇表,保存为txt文件。自动分解成中文与英文。拼写错误会自动记录在对应日期的txt中。下次继续加入新的生词本中,直到真正掌握。传说中的艾兵浩斯学习法?
import re
import string
import time
FILE_PATH = r'.\小学一年级.txt'
WRONG_WORDS = []
DATE_TIME = time.strftime("%Y-%m-%d", time.localtime())
#数字符号中文大于字母视作中文
def mixed_word(word):
english = 0
chinese = 0
number = 0
other = 0
for letter in word:
if word >= u'\u4e00' and word <= u'\u9fa5':