![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 55
ilovewindseed
这个作者很懒,什么都没留下…
展开
-
linux版wordnet安装和使用[fc13]
wordnet3.0.tar.gz 使用的是conll评测提供的版本,地址如下:http://conll.cemantix.org/2011/download/WordNet-3.0.tar.gz楼主为了安装wn3.0在实验室的fedora13机器上,遇到了一些问题,网上资料也少,最后终于安装成功,也算费尽周折,希望在此提供有益信息,减少同仁们今后的麻烦!安装步骤:1.原创 2012-11-06 10:53:46 · 1967 阅读 · 0 评论 -
stanford parser使用参数
上次使用stanford parser解析conll shared task中英文句子的时候,就遇到了句子被其中的分隔符“.”分成两句的情况,上次没有解决。现在回头做实验,才查到可以指定参数,告诉parser按照每一行来切分句子。官网的FAQ上原句是If you want to give the parser one sentence per line, include the option原创 2012-11-04 16:03:39 · 973 阅读 · 0 评论 -
RST Annotation Tool
偶然间看到的一个段落级句间关系分析工具,英文的,先mark一下。地址http://www.isi.edu/licensed-sw/RSTTool/可以分析段落里面各个句子之间的关系,网站给出的示例如图:看起来不错,还没用过,先mark一下!还有一个据称是state-of-art的text level parser唤作HILDA parser。不过online demo暂时失效,原创 2012-11-24 21:37:08 · 1056 阅读 · 1 评论 -
一些实用的语义角色标注(SRL)工具使用方法
不懂SRL的自己去扫盲吧,简言之就是predict-argument分析。找了一些工具,其中暂时调通两个1. swirlhttp://sourceforge.net/projects/swirl-parser/,可以从这下载,本工具里readme介绍较详细,主要是注意有多种输入格式。带有名实体标注的可能效果比较好,什么都没有的效果比较差一点,下面就简单说一下什么都没有的输入格式。格原创 2013-04-24 10:29:35 · 7240 阅读 · 15 评论 -
英文NLP工具包推荐
最近研究英文NLP,用到些许工具包,在此记录,免得遗忘。也希望前辈同僚们指点推荐。基本的流程是从surface开始,到浅层语义结束1. 词义词典wordnet,提供英文单词的词义、同义反义、词源等,安装配置详见http://blog.csdn.net/ilovewindseed/article/details/81476132. 语义组块分析(Chunk)CRFChun原创 2012-12-12 09:36:23 · 1387 阅读 · 0 评论 -
使用SRILM为大文件构建语言模型
文件:英文wikipedia article,预处理后大小11G系统:SUSE x64,128G内存任务:针对该数据集建立语言模型SRILM的安装和配置就不再赘述了,百度,52nlp,或者SRILM官网都很详细,根据自己机器来配置即可。贴个百度的吧http://hi.baidu.com/keyever/item/8fad8918b90b8e6b3f87ce87下面讲原创 2013-03-14 11:01:16 · 2016 阅读 · 0 评论