统计文本单词个数_英语词频统计软件功能介绍

本文介绍了英语词频统计软件的配置和功能,包括大词典配置、合成音频设置,详细讲解了统计翻译、单词对比、单词转mp3、电影字幕例句和英语文章语料例句等功能,以及解决软件崩溃和报毒的常见问题。
摘要由CSDN通过智能技术生成

6edc9d0b59d24aa56f71e7b08b68045b.png

先上个动图,一张图就看明白了。

7aa5eadf233167f771c29d3cb45da4e7.gif

ca33f8722924a802a667e12f16910cfa.png

文章目录

一.软件使用前的配置: 1

1) 大词典配置: 1

2) 合成音频功能配置: 2

二.软件功能详细介绍: 2

1)统计翻译 2

2)单词对比 4

3)单词转mp3 4

4)电影字幕例句 5

5)英语文章语料例句 功能介绍 6

三.常见问题: 7

1.为什么软件崩溃了? 7

2.为什么软件报毒? 7

一.软件使用前的配置

  1. 大词典配置:

下面的文件根据需要下载。

基本功能: 只需下载软件压缩包(英语词频统计助手.zip)即可。

如果需要更全的单词介绍: 需要再下载big_data.7z文件,解压并粘贴到软件文件夹里面。

如果需要使用合成mp3功能: 需要再下载ffmpeg并按照下文完成配置即可。

如果需要使用“在电影字幕中查找单词例句”功能: 下载“电影字幕语料.zip”,这是作者自己下载好的300个左右的字幕文件,省的你自己去射手网下载。

a8b0283075c0707150cb3e343bbb3c2a.png

软件配置完成的目录应该是下面这样:

9b49e688253c2dca1f53a56b8a71df63.png
  1. 合成音频功能配置:

如果需要使用“单词转mp3功能”,请下载ffmpeg.zip文件,并设置系统路径。设置方法请参考如下链接:https://jingyan.baidu.com/article/3065b3b6b06582becff8a48a.html

(不要使用官网最新版的ffmpeg。 作者试过,软件会出错而崩溃。作者也很迷惑,不知道是什么原因。为了节省时间,还是用网盘里面的旧版本的ffmpeg吧)

下面的有很多文字。需要用到哪个功能,再看哪个功能的介绍吧。

软件设计的操作思路清奇,估计不看下面的介绍,可能会出现莫名其妙的闪退等错误。如果有问题,先确认操作是否正确,再联系作者。

二.软件功能详细介绍

1)统计翻译

功能介绍:

1)可统计英语文本中各单词出现的个数,并对于每个单词标注音标、词义、Collins语料库词频,可导出Excel文件。

2)词形还原,比如gone和went均还原为go来统计。可选择是否进行词形还原。

3)单击右边列表中统计的单词。可以在左边英语文本中以颜色标注单词出现的位置。

4)支持添加自定义停用词,避免不必要的比如"the"等单词的统计。

5)在词典查询失败的情况下,依据百度翻译进行查询。百度翻译不能标注音标。

使用步骤:

1)点击“打开”加载需要统计单词的英文文档(支持格式:txt、docx、pdf)。

2)稍候片刻,喝口茶,看看窗外的风景放松一下。
注意:
软件默认是开启列表中显示统计内容(单词、音标、翻译等)的。但运行速度会慢。如果想快速统计大量词汇,请到"设置"中将列表显示关闭即可。最后导出的Excel文件中依旧包含翻译。

93fa17fba0c537a9dad04dba9b9f17e8.png

2)单词对比

功能介绍:

1)对两个Excel文档的第一列单词进行对比,

导出A文档独有单词,B文档独有单词,AB文档交集单词,AB并集单词。

使用步骤:

1)将需要对比的单词分别贴到两个Excel文件的第一列。

2)点击“对比”按钮,在对话框中选择需要对比的两个Excel文件。点击“打开”即可。
注意:
最好不要掺杂中文数字标点等不是单词的奇怪字符。否则,软件会莫名其妙的崩溃的。

8f838e52c73fb6e7090c1561ed225e8d.png

3)单词转mp3

功能介绍:

1)将Excel文件中的单词转换为mp3音频,用于背单词。


使用步骤:

1)将单词贴到Excel文件第一列中。点击下载mp3,然后点击合成音频即可。
注意:
此功能处理单词量不宜过大,否则可能会被屏蔽IP导致功能失效。

fb68c001205ac42340998f775ee4b461.png

4)电影字幕例句

功能介绍:

1)查找单词在英语电影字幕中的例句。

电影字幕文件需要自己到网上下载,

注意,需要是ssa或者ass格式。这样才能有中英文两种显示效果。

操作步骤:
1)自行下载字幕文件,需要是ssa或者ass格式,放到[电影字幕语料]文件夹。

2)如果从未使用此功能,需要先点击转码UTF8对下载的字幕文件进行转码。

记住每次有新添加的字幕文件的时候,都需要转码。转码一次即可。

3)点击开始整理,等显示框出现整理完成的提示后,到软件所在目录查看结果。
注意:
1)UTF8编码;
2)字幕文件需要是ssa或者ass扩展名的中英文字幕文件。其他格式字幕无效。

2eaf5b0e128b0375b378fca6c7411aec.png

66cae5e2040d5f539da1bd5b546bfd63.png

5)英语文章语料例句
功能介绍

查找单词在英语文本中的例句。
操作步骤:
1)将TXT格式UTF8编码的英语文本放到[英语文章语料]文件夹,可放置多个。
2)点击开始整理,等显示框出现整理完成的提示后,到软件所在目录查看结果。


注意:
1)如果不是UTF8编码的TXT文本,可将文本放置到zimu文件夹,点击转码。然后再拷贝到TXT文件夹即可。

三.常见问题

1.为什么软件崩溃了?

回答:请按照下面的顺序依次检查,排除故障。

1)所有使用的文本文档编码确保是UTF8,不是的话,需要转换。

2)文本只支持pdf,txt,docx,excel。注意,不支持doc格式。

pdf有时候会有奇怪的错误。最稳妥最推荐的是TXT格式。

3)各文件路径、文件名是否正确。不要修改默认的文件名。

4)软件只在win7 64位系统上运行测试过。

5)如果出现奇怪的“Error loading ....LoadLibrary:找不到指定的程序”的警告并且打不开软件的情况,

请将警告的内容输入百度搜索中在网上查找答案。

需要安装补丁。这种情况很少,大部分都是下载完打开即可使用。

6)以上都不好用,联系作者解决。

  1. 为什么软件报毒?

回答:

关于360等杀毒软件报毒

软件在下载解压后,会出现报毒的情况。如下图。

530bb9d4080e9d17c5b3b5f203b02cda.png

这个需要解释一下,我使用的编程语言是python,打包工具是pyinstaller,由于打包工具的原因造成被很多杀毒软件误报。比如如下360论坛的反馈。即使很普通的程序也会被报毒。

https://bbs.360.cn/thread-15814807-1-1.html

https://bbs.360.cn/thread-14646437-1-1.html

https://bbs.360.cn/thread-15674965-1-1.html

464c79e21557c0fca251c1d0fabb2bae.png

下面的链接是腾讯管家对于这个误报问题的反馈。

https://www.v2ex.com/t/424214

对于打包工具pyinstaller的问题反馈区也可以查看到AVG对打包后的exe报毒的用户反馈。

https://github.com/pyinstaller/pyinstaller/issues/1821

https://github.com/pyinstaller/pyinstaller/issues/603

解决办法也只能是:

“Please contact you anti-virus vendor. There is nothing(!) we can do here.”

442b28b7015b041ef29d5eab083ededb.png

目前,只能是申诉来避免被误报。已经向360提出申诉(https://fuwu.360.cn/shensu/)。其他的杀毒软件暂时没有提申诉。以后可能每次打包成新版本都要申诉一次。将来会考虑做个软件主页网站,申报信息加入360开发者平台(https://open.soft.360.cn/regist.php?usertype=0)。

f34d84d46017c9c9db798a9dec27c329.png

下面说明如何添加信任。如果解压后被删,点击找回并添加信任即可。如果是扫描提示报毒,鼠标放到扫描结果上,显示“详情”,点击“详情”,选择添加信任即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值