英语教材提取单词制作生词表

本文介绍如何通过vim编辑器结合Python和正则表达式,从英语教材中高效地提取单词,去除重复并排除含有数字的部分,进一步利用字典生成生词表。
摘要由CSDN通过智能技术生成

英语教材提取单词制作生词表

教材分解成单词

vim下:

  • 以非英语字符为界,切割所有文本

:%s/\W/\r/g

  • 删除重复单词,并排序

:sort u

  • 删除含有数字的“单词”部分

:g/\d/d

查英语字典生成单词表

  • Python

import pandas as pd

#读入单词和字典

words = pd.read_csv('words.txt',encoding='UTF-8'
如果你曾为扩大词汇量而背过字典或词汇书,你一定有如下懊丧的体会:在背完了一类字母的单词后,在阅读中再遇到此类单词时仍不记得单词的意思,只是觉得眼熟,觉得背过这个单词,拿起字典一看,记忆立刻恢复,轻松地拼写出这个单词。 造成这个现象的原因是: 第一,单词在字典里的顺序位置对我们的记忆起到了助记的作用。单词放在字典中,我们能够轻松的拼写这个单词,并能拼写出这个单词的相邻的单词,一旦离开了字典这个辅助记忆的环境,在阅读中再遇到这个单词,就会有似相识的感觉,明明知道背过这个单词,却不知道单词的汉语意思; 第二,在背字典的同时我们大多把记忆重点放在了单词的拼写上,忽视了单词的中文意思,特别实在单词具有多种词性和多种语义的时候。这造成了我们“会拼写却不知道中文意思”的弊病; 第三,背字典大多是脱离了句子,即语言环境来记忆的,这种记忆造成我们“看得懂单词却不会用单词”的弊病,同时也降低了记忆效率。 记忆的要素是在不同的地点不同的场合重复记忆,才会加深我们脑海中的印象。通过这个小软件取出随机文章中的英文单词,可以加强和检验记忆效果,增强成就感。配合金山词霸的鼠标取词效果更好。 本软件为绿色软件,拷贝到任意目录运行即可,不合意删之;同时本软件为免费软件,不需注册,没有广告。 如果您喜欢这个软件或者有什么改进意见,Let me know。
说明 此版本仅仅为测试版,是我一时兴起写了半个小时的产物。。。所以许多方面未能完善,希望大家多多提意见,也希望有人能继续编写。 此程序根据“杨鹏17天背词法”及“艾宾浩斯记忆曲线”编写,可以帮用户生成一个“*天背单词计划”,各个list都会在一定天数内重复1~5次,有助于用户牢固、快速背单词,是背四六级、托福、gre单词的居家旅行必备良品~ 编写缘由 最近在拿新东方的托福红宝书背词,>_<有些单词背完了忘、忘完了背,最后是背下来了,但是花费的时间实在不少,十分纠结。况且我还是最近闲的,如果是处在艰难备考期的同志们遇到背单词的问题肯定更是急得跳脚了吧……于是胡乱背的我开始在网上搜“单词记忆法”这种东西,然后就搜到了“杨鹏17 天gre的表格”,顿时觉得如获至宝,该表格根据大众记忆曲线挑出了最好的复习时间,能让人用尽量少的时间记牢单词,解放了许多在词海中苦苦遨游数个月的考生。可是,gre对我来说级别太高,我还是先背背大学四级、托福比较实际,于是我又开始搜……结果只搜到根据“toefl词汇 词根+联想-俞敏洪 35list版本”的表格,= =十分懊恼,只好自己拿excel根据最基本的记忆法开始列计划表。结果,列了两行就发疯乱套了= =这样,才想到写个小程序,自定义“每日背list数”、“单词书list总数”(网上搜到的表格基本都是按35个list写的,但是我买的书是45个 list= =……)方便自己日后列表、方便大众背单词
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

gongqingkui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值