自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (7)
  • 问答 (4)
  • 收藏
  • 关注

翻译 Stanford POS tagger FAQ

原网页http://nlp.stanford.edu/software/pos-tagger-faq.shtml 对Stanford POS tagger FAQ进行翻译

2017-02-27 19:38:23 2026

原创 Stanford Tagger 词性标注

斯坦福词性标注,Stanford Log-linear Part-Of-Speech Tagger 在eclipse中的使用

2017-02-27 11:50:40 4333

原创 自然语言处理相关书籍

书籍《Natural Language Processing with Java.pdf 》

2017-02-26 19:58:35 1464

原创 Stanford Parser使用

用Stanford Parser解析句子,生成句法树。介绍了最基本的使用方法。

2017-02-25 20:01:35 5769 1

翻译 Stanford Parser常见问题

翻译,原文来自于:http://nlp.stanford.edu/software/parser-faq.shtml 1.parser模型在哪? 2.哪里有parser的技术文档? 3.如何使用API? 4.在parser中,什么是词性标记,短语类别,类型依赖? 5.我如何训练parser? 6.我如何训练RNN parser? 7.在训练我自己的parser模型之后,为什么会报异常“

2017-02-24 22:47:04 5053

原创 stanford-ner命名实体识别基本使用

命名实体识别(NER),可以使用Stanford NER开源工具。本文介绍如何在eclipse中,对中文进行命名实体识别,入门操作介绍。

2017-02-22 19:05:17 10973 7

原创 查看大文件

打开大文件查看内容的几种办法

2017-02-22 15:00:42 642

转载 中文维基百科语料上的Word2Vec实验

此文主要参考52nlp-中英文维基百科语料上的Word2Vec实验,按照上面的步骤来做的,略有改动,因此不完全是转载的。这里,为了方便大家可以更快地运行gensim中的word2vec模型,我提供了wiki.zh.text.model与wiki.zh.text.vector的下载链接,http://download.csdn.net/detail/yangyangrenren/9859895

2017-02-22 12:10:42 17939 14

维基百科中文语料word2vec训练后结果

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。

2017-06-03

Stanford typed dependencies manual

Revised for the Stanford Parser v. 3.7.0 in September 2016 Stanford parser的类型依赖说明

2017-02-27

java自然语言处理英文

使用java进行自然语言处理,电子书。pdf文字版,不是扫描版。

2017-02-26

wiki.zh.text.model

中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。

2017-02-23

phantomjs-2.1.1-linux-x86_64.tar.bz2

ubuntu(或者linux)平台上安装phantomjs。这是从官网上下载的。

2017-01-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除