- 博客(7)
- 收藏
- 关注
原创 自动语法错误校正(Grammatical Error Correction)
写英语论文很折磨人。平时用英语写的少,关键时候写的头痛死。记起前段时间在知乎上看了一个哥们写的NLP潜在热门方向,介绍了自动语法错误校正(具体名称记不起来了,当时没有收藏,现在找不到了)。就不知道怎么想到NLPCC2014上新加坡国立大学Hwee Tou Ng教授的特邀报告Automated Grammatical Error Correction: The State of the Art。
2015-05-26 21:40:46 8251 2
原创 双语词表征(bilingual word representation)
关于词表征(word representation) 的解释,可以参考博客《Deep Learning in NLP (一)词向量和语言模型》和ACL2010年的论文 Word representations: A simple and general method for semi-supervised learning。 ACL论文给出的解释是: A word repres
2015-05-22 13:51:20 4692 1
原创 Python标准库cPickle包存储对象报错
python的cPickle包介绍:点击打开链接问题:一千万个30维度的向量存储在文本中,每个向量一行,元素以tab键隔开。在使用cPickle写对象时候报错:google后发现下面三个关于这个的问题:https://github.com/numpy/numpy/issues/2396http://bugs.python.org/issue11872ht
2015-05-15 18:43:39 1170
原创 微软句向量工具包Sent2vec
工具包地址:http://research.microsoft.com/en-us/downloads/731572aa-98e4-4c50-b99d-ae3f0c9562b9/default.aspxSlides:http://emnlp2014.org/material/presentation-EMNLP2014002.pdf源自:http://wei
2015-05-13 10:02:50 14029 1
原创 paragraph2vec工作受质疑
Quoc V. Le ICML2014的工作《Distributed Representations of Sentences and Documents》一直饱受争议,很多学者都宣称其工作无法重现。 ICLR2015文章《ENSEMBLE OF GENERATIVE ANDDISCRIMINATIVETECHNIQUES FORSENTIMENTANALYSIS OFMOVIER
2015-05-11 19:52:07 5030
原创 维基实体相关度计算 笔记
读清华大学刘知远老师的今年的一篇IJCAI文章Representation Learning for Measuring Entity Relatedness with Rich Information。相比词汇相似度计算,维基实体相关度计算更加挖掘维基百科语料库的特性。其相关性计算大致分为三类:1. text-theoretic 利用维基百科语料的海量特性。通过统计的方法进行词汇表征
2015-05-08 10:43:30 1283
原创 中文词汇语义相关度的测试集(免费)
在看清华大学刘知远老师的今年的一篇IJCAI文章Representation Learning for Measuring Entity Relatedness with Rich Information,发现他们的实验是在中文上做的。实验测试集合引用的是国防科大11年的一篇《基于中文维基百科链接结构与分类体系的语义相关度计算》所公布的测试集合。Words-240测试集地址:http://ww
2015-05-08 09:53:44 2321 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人