- 博客(0)
- 资源 (21)
- 收藏
- 关注
PDF转EXE文件,保护文件版权
可以将pdf文件转成一个exe的文件,这个exe文件可识别用户的电脑,根据该电脑的机器码生成一个对应的密码。也就是说,发布这个pdf文件的用户,如果需要授权给使用者,则只有发布者根据使用者的机器码给一个对应的密码,使用者才可以打开该pdf文件,通过这种办法让用户不能够广泛传播,保证自己的版权不收侵犯。
2018-09-10
GeoGebra 动态几何软件
完全免费的类似几何画板的动态数学软件,支持数十种语言,支持多平台,获得多项国际性大奖。功能非常强大,比如在统计方面的应用是几何画板所无法比拟的,另外,还具有强大的命令和函数等功能,绝对是广大数学教师不可多得的教学辅助软件。
2015-09-21
Concordance Randomizer
ConcSampler & Concordance Randomizer :在语料库研究中,研究者经常要面对成千上万条索引行,Sinclair建议每次随机抽取30条记录进行观察,总结其中的规律,然后再抽取30条记录,以此类推,直到无法观察到新的模式为止。
2015-09-21
BFSU_Stanford_Parser1.0(英文自动句法分析工具)
stanford parser中文句法分析时注意的问题 .
分类: NLP 2013-04-10 15:43 1091人阅读 评论(0) 收藏 举报
最近做中文自然语句语义分析方面的事情,要用到中文NLP技术,于是在stanford university的NLP小组web页上下载相关java包,开始应用。
第一步:导入parser的包和相关的文件,并在项目中添加对包的引用。截图如下所示:
第二步:在入口java文件里面编写具体引用的Model,代码如下:
LexicalizedParser lp = LexicalizedParser.loadModel("model/englishPCFG.ser.gz");//这里引用的路径根据自己建的目录来
这里碰到的问题也记录下来,如果引用的是“model/chinesePCFG.ser.gz”那么后面做中文语句的句法分析报错,截图如下:
没找到相关API的说明,因此这里没搞清楚原因。但是如果就使用“model/englishPCFG.ser.gz”是正确的,望各位同学使用时一定注意。
第三步:初步使用parser,体验不错哦。对于语句“西瓜的描述”中文语句,句法依赖关系输出截图如下:
小 结:总体上来说引用了该包以后就可以方便使用啦,但是有很多api实在是不知道做啥用的,也没有找到API doc。希望有doc的同学能发给我一份,不胜感激!
2015-09-21
BFSU Sentence Collector 1.0(例句提取工具)
BFSU Sentence Collector 1.0:用于英语教学的索引工具,内置大学英语教材语料库(http://www.corpus4u.org/forum/showthread.php?t=3217)与四级词表。与上文介绍的索引工具不同的是其呈现方式为含有检索词的整句;另外用户可以根据句子长度和句子中的新词数(未出现在四级词表中的单词)来筛选例句。该工具支持正则表达式检索,如输入as \S+ as可以检索出含有as well as、as much as等短语的例句。
2015-09-21
BFSU ParaConc
1、 该软件只支持ANSI编码文本,不支持Unicode编码文本。
2、 汉语文本可不进行分词处理。
3、 中英文文本文件要求分别以*.ZH.txt和*.EN.txt方式命名。
4、 数据文件必须严格行对齐,如包含空行也必须达到文本对应,即平行文件的对应行都是空的。软件不能智能自动对齐语料。
5、 软件支持正则表达式检索。
6、 软件默认支持英文词形还原检索(lemmatized search),如,检索go,可得到含有go、goes、went、going、gone等的平行句对。去除lemmatized前的复选框,则可以检索实际输入的检索项(比如搜goes,只能得到含goes的平行句对)。
7、 软件还支持对应语言文本中包含或不含(exclude)某词项的检索。如检索education,以及结果中包含(或不含)“教育”的句对。
8、 结果可存为tab符分隔的文本文件,便于后续分析。
2015-09-21
BFSU NewWord Marker 1.0
BFSU NewWord Marker 1.0用法示例(图4):
(1)选择待标记文本。
(2)设置输出格式。如句子序号、长度以及每句中新词个数等。
(3)选择基准词表。
2015-09-21
AntConc3.2.0的使用说明
语料库软1. 提取语境共现
1.1设置检索项
(1)单项检索
a) 点击file下拉菜单中的“open files”,选择要打开的语料(如果想打开整个文件夹,可以选择open directory);
b) 在“Search Term”一栏键入要检索的词项,如go;
c) 在“Search Window Size” 一栏设置每一共现行出现的词数;
d) 点击 ,开始检索。
检索结果如图1.1所示:
图1.1单项检索结果
(2)多项检索
设置多项检索
除了检索单个词项以外,AntConc还具有检索多个词项的功能,检索方法为在检索项间键入“|”符号。
例:要检索动词go的各种时态形式,可在“Search Term”中输入go|went|gone|goes
设置语境词检索
为了限制语境共现的检索,可以设定一个语境词在检索项周边一定的语境范围内出现。
例:如要研究 a … of 这一类词组,可通过AntConc提取所有的词项,检索方法如下:
a) 在“Search Term”一栏键入a;
b) 点击“Search Term”旁的 ,进入“Advanced Search”界面,如图1.2所示。点击“Use context words and horizons”,然后在“Context Words”一栏键入of,点击 。如要重新设置语境词,可先点击 清除原来语境词,后重复以上操作。另外,还需设定语境词距离检索项的位置,如本研究中,of在a的右二位置,所以“Content Horizon”确定为 ,最后点击 ;
c) 回到语境共现的界面后,点击 ,开始检索。结果可提取a lot of, a bit of 等词块。
设置多字语检索
在研究中,如需检索多个词项,除了使用“|”以外,也可使用以下方法,尤其适合检索项数目较多的情况。
例:研究感官动词watch, sound, feel, hear, smell
a) 在TXT文本中键入所有要检索的词项,可多达250个词。然后为该文本起名保存。需注意:键入的词项需以列的形式排列。如:
feel
feels
felt
b) 点击Search Term旁的 ,选择“Use search term(s) from list below”。 点击
,在保存以上新建的文本的盘符路径点击文本名,然后点击 ;
c) 回到语境共现的界面后,点击 ,开始检索。
件
2015-09-21
语料库wordsmith6.0软件(最新英文版)
WordSmith Tools
是一个在Window下运行的用来观测文字在文本中的表现的功能强大的综合软件包。它共包含Concord (语境共现检索工具)、WordList (词频列表检索工具)
、KeyWords(关键词检索工具)、Splitter(文本分割工具)、Text Converter (文本替换工具)、Viewer(文本浏览工具)等六个程序,其中前面三个程序是主要的文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫WordSmith Tools Controller(文字匠工具控制器)的程序来控制。
2015-01-22
Alike Duplicate Image Finder 2.2
也许你从网上下载了很多图片,但是其中有相当一部分是差不多的:比如只是图片名称、格式、大小甚至清晰度的不同、或者是图片上有不同网站的标记、或者图片之间只是人物的姿势稍有不同,如果能很方便地把它们清理一遍,将节约大量的磁盘空间,又何乐而不为呢?现在使用 Alike-重复图片搜索的利器,就能帮你轻松搞定,软件能够方便地调节图片的相似程度,直至完全精确地相同。
本软件操作简单,帮助文件也已经进行了翻译,新手也能很快上手,第一次使用时请运行目录里的“key.reg”文件注册以下,否则不能使用。
2015-01-22
能够轻松查找到系统中的重复文件,并删除。绿色免安装
重复文件清理工具。查找,清理。你的系统里肯定有重复的文件,拿图片做例子,你可能今天保存了一张一年之前已经保存了的图片。这个软件有什么用呢?它们会帮你比较系统里的文件文件名,文件尺寸,修改日期和CRC32效验等等,帮你找出相同的文件。找出来有什么用?删除!
2010-04-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人