![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
小有名气的可爱鬼
这个作者很懒,什么都没留下…
展开
-
Cognitive Graph for Multi-Hop Reading Comprehension at Scale解说
我们提出了一个新的CogQA框架,用于网络规模的多跳问题回答文件。该框架以认知科学中的双过程理论为基础,通过协调隐式提取模块(系统1)和显式推理模块(系统2),在迭代过程中逐步构建认知图。在给出准确答案的同时,我们的框架还提供了可解释的推理路径。具体地说,我们的1基于BERT和图形神经网络(GNN)的实现可以有效地处理HotpotQA-fullwiki数据集中的数百万个多跳推理问题文档,在排行榜上取得了34.9的联合分数,而在最佳竞争对手中只有23.6分1 Introduction深度学习模式在机器原创 2020-07-25 23:24:40 · 669 阅读 · 0 评论 -
TF-IDF的神秘面纱
TF-IDF算法TF-IDF算法:计算单词权重最为有效的实现方法就是TF-IDF,以特征词在文档d中出现的次数与包含该特征词的文档数之比作为该词的权重。TF(term frequency)词频统计:区别文档最有意义的词语应该是那些在文档中出现频率高,而在整个文档集合的其他文档中出现频率少的词语,因此引入TF,计算单词的词频。IDF(inverse document frequency)逆文本频度:一个单词出现的文本频数越小,它区别不同类别文本的能力就越大。因此引入了逆文本频度IDF的概念。原创 2020-06-04 16:58:20 · 285 阅读 · 0 评论 -
文本处理——Embedding、Word embedding、Word2vec 之说
这篇主要就是想让大家了解下 Embedding、word embedding、word2vec的一些相关知识。Embedding在数学上表示一个单射的、结构保持的映射 f: X -> Y, 也就是一个function,此处的结构保持的具体含义要依赖于X 和 Y 是哪种数学结构的实例而定。举个例子:我们可以把整数“嵌入”进有理数之中。显然,整数是一个group,同时它又是有理数的一个subgroup。整数集合中的每个整数,在有理数集合中都能找到一个唯一的对应(其实就是它本身)。同时,整数集合中的每个整数原创 2020-06-03 23:50:20 · 1420 阅读 · 0 评论