NLP论文阅读
咖乐布小部
NLP算法工程师,欢迎交流,一起学习!
展开
-
Named Entity Recognition for Chinese Social Media with Jointly Trained Embeddings
Named Entity Recognition for Chinese Social Mediawith Jointly Trained Embeddings一、研究对象:中文社交媒体信息的命名实体识别。命名实体识别是一个非常重要的组成部分,是关系抽取和实体联系的第一步二、对象特点:三、问题描述:1.NER for Chinese Social Media:和其他语言一样,社交媒体信息对于命名实体识别存在很多问题,例如贫血错误,新颖词汇,没有语法结构。而汉语存在更多的挑战。1.缺少一个此.原创 2020-11-22 11:29:13 · 420 阅读 · 0 评论 -
自然语言处理方面的顶会
转载:「自然语言处理(NLP)」你必须要知道的八个国际会议!引言 国际学术会议是一种学术影响度较高的会议,它具有国际性、权威性、高知识性、高互动性等特点,其参会者一般为科学家、学者、教师等。具有高学历的研究人员把它作为一种科研学术的交流方式,够为科研成果的发表和对科研学术论文的研讨提供一种途径 ;同时也能促进科研学术理论水平的提高。针对自然语言处理方向比较重要的几个会议有:ACL、EMNLP、NAACL、CoNLL、COLING、ICLR、AAAI、NLPCC等ACL会议(Annual转载 2020-11-19 20:50:14 · 1446 阅读 · 0 评论 -
Distributed-representations-of-words-and-phrases- and-their-compositionality-Paper
Distributed-representations-of-words-and-phrases-and-their-compositionality-Paper最近介绍的continuous skip-gram 模型能够有效地学习高质量的分布式向量表示。本文提出了几个拓展能够提高向量的质量和训练速度。——通过二次词频采样获得显著的加速和更规律的词表示。——提出一个更简单的hierarchical softmax 替代模型 称之为负采样。行文结构:围绕摘要1.首先Introduction,介绍了原创 2020-11-15 19:20:35 · 246 阅读 · 0 评论 -
Efficient Estimation of Word Representations in vector space 论文阅读
Efficient Estimation of Word Representations in vector space Tomas Mikolov、Kai Chen、Greg Corrado、Jeffrey Dean一、研究对象:词向量表示的质量。二、现有模型:NNLM、N-gram model、LSA、LDA等三、现有模型不足:将单词做为一个独立的单元对待,与词之间没有联系。这有一定的好处:简洁,鲁棒性好。现有模型认为简单模型在大的数据集训练结果比复杂模型在小的...原创 2020-11-08 11:33:27 · 1209 阅读 · 1 评论