AI维基

计算智能和高性能计算

排序:
默认
按更新时间
按访问量

Word2Vec模型总结

Huffman树的构造 解析:给定n个权值作为n个叶子节点,构造一棵二叉树,若它的带权路径长度达到最小,则称这样的二叉树为最优二叉树,也称Huffman树。数的带权路径长度规定为所有叶子节点的带权路径长度之和。Huffman树构造,如下所示: (1)将{w1,w2,...,w3}\{w_1,w...

2017-11-05 12:01:53

阅读数:282

评论数:0

自然语言处理学习日记5

1. Deep Learning与中文分词 解析:字向量。 2. MatchZoo介绍 解析:MatchZoo是一个Python环境下基于TensorFlow开发的开源文本匹配工具,可以更加直观地了解深度文本匹配模型的设计、更加便利地比较不同模型的性能差异、更加快捷地开发新型的深度匹配模型。Mat...

2017-10-16 21:56:23

阅读数:237

评论数:2

自然语言处理学习日记4

1. CTB 6.0的标注体系 解析: (1)词类标记(33个) (2)句法标记(23个):短语标记(17个);动词复合标记(6个) (3)功能标记(26个) (4)空范畴标记(7个) 2. JAXB 解析:JAXB(Java Architecture for XML Binding) 是一...

2017-08-25 09:59:26

阅读数:314

评论数:0

自然语言处理学习日记3

1. 编译和安装CRF++ 0.58 [1] 解析: (1)C++:./configure;make;make install (2)Python:yum install python-devel;python setup.py build;python setup.py install 2....

2017-08-09 23:51:19

阅读数:845

评论数:0

自然语言处理学习日记2

1. Hamcrest 解析:Hamcrest是一个书写匹配器对象时允许直接定义匹配规则的框架。 2. JUnit 解析:JUnit是一个Java编程语言编写的单元测试框架。 3. 中文分词常用模型 解析: (1)正向(逆向)最大匹配。 (2)双向最大匹配。 (3)最大熵模型。 (4)条件...

2017-08-04 16:34:41

阅读数:674

评论数:0

自然语言处理学习日记1

1. Stanford CoreNLP 解析:tokenize,cleanxml,ssplit,pos,lemma,ner,regexner,sentiment,truecase,parse,depparse,dcoref,relation,natlog,quote。   2. NLTK(N...

2017-07-25 17:12:22

阅读数:1251

评论数:0

提示
确定要删除当前文章?
取消 删除