nlp
文章平均质量分 57
机器喵喵喵喵
这个作者很懒,什么都没留下…
展开
-
word2vec实验经验总结
最近进行的项目,前期要求利用word2vec做相关的向量化处理,于是作为小白从头开始学习word2vec的基本原理,然后开始实验练手。在这里po一些学习和实验过程中的资料、注意点和经验点。 基本原理篇 原理上读了Mikolov 2013年的 Efficient Estimation of Word Representations in Vector Space,里面提出两种模型CBOW和S原创 2016-11-20 17:59:14 · 1648 阅读 · 0 评论 -
python3.5.2下载安装Tensorflow
最近开始学习Google的人工智能框架Tensorflow,会开始记录过程中的问题和心得等等。 首先我的环境是ubuntu16.04 + python3.5.2+anaconda3。 其实官方提供了针对于各种平台以及适用于python2.7和python3的安装方法:Tensorflow官网 也可以看极客学院提供的Tensorflow官方文档中文版在这里我主要讲讲针对于python3.5+版本原创 2016-11-27 14:54:15 · 18388 阅读 · 2 评论 -
Linux上安装PyLucene
首先我的环境:ubuntu16.04Anaconda3下 python3.5.2/python2.7JDK1.8.0_102PyLucene6.4.1Step0.安装openjdk 开始因为我自己原来装了jdk1.8.0_102,认为直接用原来装的也可以,但是后来安装JCC的时候会蜜汁报错,所以又重新装了新的openjdk,问题解决。$sudo apt-get install openj原创 2017-02-24 14:04:55 · 3189 阅读 · 0 评论 -
Penn Treebank 词性标注集
参考资料:http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.htmlAlphabetical list of part-of-speech tags used in the Penn Treebank Project:NumberTagDescripti转载 2017-04-21 11:25:57 · 3176 阅读 · 0 评论