NLP
小妖精Fsky
这个作者很懒,什么都没留下…
展开
-
NLP中三种特征抽取器的优与劣
RNN ( LSTM, GRU ) :缺点(1):无法并行,因此速度较慢(2):RNN无法很好地学习到全局的结构信息,尤其对于序列结构很长的CNN:BERT:原创 2020-04-25 11:28:35 · 874 阅读 · 0 评论 -
NLP知识要点总结
NLP四大任务类型:分类、序列标注、文本匹配、文本生成练习地址:https://github.com/FudanNLP/nlp-beginnerhttps://www.zhihu.com/question/324189960原创 2019-06-30 22:53:45 · 461 阅读 · 0 评论 -
NLP中各任务介绍
为了拓展自己看文章的领域,所以有些任务不太清楚,所以记录下,这样下次看到什么任务不清楚的,就可以查看了, 一.句子压缩(sentence compression) 1. 问题描述 句子压缩,顾名思义,就是把长句子压缩成短句子。输入:原始句 x=x1,x2,x3,...,xnx=x1,x2,x3,...,xnx = x{_1},x_{2},x_{3},...,x_{n} 目标输出:...原创 2018-07-13 11:19:02 · 1679 阅读 · 0 评论 -
挖掘出的NLP领域的牛人
也许这些人都很大牛,只是我刚刚意识到,为了方便以后查阅这些人的研究成功,特此备案Mohit Bansal:http://www.cs.unc.edu/~mbansal/原创 2016-10-07 22:11:03 · 1824 阅读 · 0 评论 -
一起读论文
发现别人读文章做笔记很好的博客,特意收集在此,也督促自己每天看一到两篇文章,只有多读才能扩展自己的思维,遇到问题有想法解决。 http://zhanghaoyu1993.github.io/原创 2017-05-28 11:16:19 · 757 阅读 · 0 评论 -
batch-GD, SGD, Mini-batch-GD, Stochastic GD, Online-GD -- 大数据背景下的梯度训练算法
原地址:http://www.cnblogs.com/richqian/p/4549590.html机器学习中梯度下降(Gradient Descent, GD)算法只需要计算损失函数的一阶导数,计算代价小,非常适合训练数据非常大的应用。梯度下降法的物理意义很好理解,就是沿着当前点的梯度方向进行线搜索,找到下一个迭代点。但是,为什么有会派生出 batch、mini-batch、转载 2015-12-11 10:05:13 · 1389 阅读 · 0 评论 -
AI顶级会议列表 & ACL相关
The First Class: tier-1的conferences, 其实基本上就是AI里面大家比较公认的top conference. 下面同分的按字母序排列. IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个领域就没几篇了,象machine l转载 2015-10-14 20:54:45 · 1962 阅读 · 0 评论 -
2015年自然语言处理顶级会议EMNLP都讲了些什么?
原地址:http://www.dataguru.cn/article-8222-1.html摘要: 2015年EMNLP自然语言处理实证方法会议(Conferenceon Empirical Methods in Natural Language Processing)于2015年9月17-22日在葡萄牙里斯本市召开。EMNLP是自然语言处理领域的顶级会议,由ACL学会下属特殊兴趣小组转载 2015-10-14 19:43:50 · 4895 阅读 · 1 评论 -
词干提取(stemming)和词形还原(lemmatization)
词形还原(lemmatization),是把一个任何形式的语言词汇还原为一般形式(能表达完整语义),而词干提取(stemming)是抽取词的词干或词根形式(不一定能够表达完整语义)。词形还原和词干提取是词形规范化的两类重要方式,都能够达到有效归并词形的目的,二者既有联系也有区别现将共同点和联系总结为以下4方面: (1)目标一致。词干提取和词形还原的目标均为将词转载 2015-01-12 11:38:23 · 3120 阅读 · 0 评论 -
Word2Vec
word2vec(word to vector)是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。word2vec为计算向量词提供了一种有效的连续词袋(bag-of-words)和skip-gram架构实现。原创 2014-10-15 11:04:56 · 740 阅读 · 0 评论