- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 ACL 2016 Accepted Papers
1.Long papersA CALL system for learning preposition usageJohn LeeA Character-level Decoder without Explicit Segmentation for Neural Machine TranslationJunyoung Chung, Kyunghyun Cho a
2017-05-30 22:39:09 4966
原创 我的学习网址收藏
1.将门分享https://mp.weixin.qq.com/s?__biz=MzAxMzc2NDAxOQ==&mid=502876225&idx=1&sn=25894a894cc2c58214ddde13e0a8ef93&chksm=03907c9d34e7f58b8ae3dba8dc4662957b4c5a131cc7955478b58a9821028c0495...
2017-05-26 22:46:31 1538
原创 GloVe学习笔记
介绍: GloVe是一种用于获取词汇向量表示的无监督学习算法。 对来自语料库的聚合全局字词同现统计进行训练,并且所得到的表示展示了字矢量空间的有趣的线性子结构。 官网主页地址:https://nlp.stanford.edu/projects/glove/Github:https://github.com/stanfordnlp/GloVe论文下载地址:htt
2017-05-24 21:50:33 4749
原创 cips2016-中文信息处理发展阅读笔记
第一章 词法和句法分析研究进展、现状及趋势1.自然语言处理中的自然语言句子级分析技术,可以大致分为词法分析、句法分析、语义分析三个层面。第一层面的词法分析(lexical analysis)包括汉语分词和词性标注两部分。第二个层面的句法分析(syntactic parsing)是对输入的文本句子进行分析以得到句子的句法结构的处理过程。根据句法结构的表示形式不同,最常见的句法
2017-05-21 23:54:09 3664 2
原创 wordembedding评价
1.第一类指标为评价词向量的语言学特性标准的WordSim353 数据集(语义相关性)(ws)TOEFL 数据集(同义词检测)(tfl)单词类比(sem,syn)单词语义:(sem): 9000个问题。queen-king+man=women。准确率(questions-words.txt)单词句法类比(syn): 1W个问题。dancing-dance+predict=pre
2017-05-21 23:44:44 2560
原创 维基百科数据库处理,用于训练word2vec
维基百科中文数据1.在维基百科上下载中文数据,实时的2.使用Wikipedia Extractor抽取文本(http://medialab.di.unipi.it/wiki/Wikipedia_Extractor)(半小时内完成)3.使用opencc转换成简体4.清除文本的符号和数字,用word_qufuhao进一步工作:对数据集进行进一步优化:1.清除
2017-05-21 23:42:33 2679
原创 word2vec使用说明
word2vec是谷歌2013年开源的工具,原始论文,这个工具能比较高效的训练出词向量。word2vec 代码参数说明:默认:./word2vec -train text8 -output vectors.bin -cbow 0 -size 100 -window 5 -negative 0 -hs 1 -sample 1e-4 -threads 20 -binary 1 -i
2017-05-21 23:28:28 1682
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人