NLP
Sherryllll
这个作者很懒,什么都没留下…
展开
-
NLTK中使用Stanford parser
原文链接:http://blog.csdn.net/qq_19670461/article/details/42681551nltk工具包中有一个用于自然语言句法分析的文件夹parse(地址C:\Python27\Lib\site-packages\nltk\parse\stanford.py)。其中stanford.py就是我们要用的stanford parser的源文件,这里面有parser的接转载 2015-04-22 16:47:05 · 10250 阅读 · 5 评论 -
python nltk 基本操作
分词nltk.sent_tokenize(text) #按句子分割 nltk.word_tokenize(sentence) #分词 nltk的分词是句子级别的,所以对于一篇文档首先要将文章按句子进行分割,然后句子进行分词: 词性标注nltk.pos_tag(tokens) #对分词后的句子进行词性标注tags = [nltk.pos_tag(tokens) for token原创 2015-04-22 16:08:45 · 21659 阅读 · 0 评论 -
stanford parser 使用
原文链接: 1、到斯坦福官方网站http://nlp.stnford.edu/software/lex-parser.shtml下载软件包,解压。2、在eclipse中新建一个java project,把解压得到根目录下的stanford-parser.jar和stanford-parser-2.0.4-models.jar(不同版本文件名可能有差异)两个包导入项目到项目引用包中,然后把解压得到转载 2015-04-17 10:54:18 · 1436 阅读 · 0 评论 -
Apache UIMA(一)简介
最近要使用UIMA来做文本挖掘相关工作,写下自己学习和使用它的过程,希望这次能坚持写。以下内容基本都是基于Apache UIMA网站上的说明或文档,具体的可以在文末的参考链接中找到。what is UIMAUIMA 是一个用于分析非结构化内容(比如文本、视频和音频)的组件架构和软件框架实现。一个UIMA的应用示例是可以读入文本识别实体或者关系,如人名,地名,组织或者人和组织间的供职关系,人和地点间的原创 2016-08-16 09:30:10 · 4388 阅读 · 0 评论 -
Eclipse运行UIMA示例程序出错:找不到或无法加载主类
今天尝试运行示例文件一直出错,很奇怪,命名jar包已经在了,最后在参考文献这篇博客中找到解决办法,但依然很疑惑。。。 在UIMA的文档中,尝试按照文档的做法运行example中的Document Analyzer出现如下错误:找不到或无法加载主类 org.apache.uima.tools.docanalyzer.DocumentAnalyzer解决办法: 点击Eclipse菜单的Run ->原创 2016-08-17 15:12:38 · 957 阅读 · 0 评论 -
Apache UIMA(二):配置Eclipse来使用UIMA
本文就假设你已经安装好了Eclipse啦,所以Eclipse的安装配置就跳过了。安装UIMA SDK在UIMA网站上下载UIMA SDK http://incubator.apache.org/uima 解压后放在某个你习惯的目录下,然后设置环境变量 UIMA_HOME,指向你的这个解压文件目录,解压后叫apache_uima,然后再PATH中加上%UIMA_HOME%\bin 安装后按照r原创 2016-08-16 11:24:47 · 2531 阅读 · 0 评论