- 博客(6)
- 收藏
- 关注
原创 Entity-Duet Neural Ranking: Understanding the Role of Knowledge Graph Semantics in Neural Informatio
摘要:本文提出了双实体神经排序模型(EDRM),该模型将知识图谱引入神经搜索系统。EDRM用词和实体表示查询和文档。来自知识图谱的语义被集成在它的实体的分布式表示中,而排名则是通过基于交互的神经排名网络进行的。这两个组件是端到端学习的,这使EDRM自然地成为面向实体的搜索和神经信息检索的组合。我们在商业搜索日志上的实验证明了EDRM的有效性。我们的分析表明,知识图谱的语义显着提高了神经排序模型的...
2020-01-01 02:15:58
735
原创 Cross-lingual event-centered news clustering based on elements semantic correlations of news
基于不同新闻元素语义相关性的跨语言事件中心新闻聚类
2019-12-26 11:03:35
213
原创 Cross-lingual Document Retrieval using Regularized Wasserstein Distance
使用正则化的Wasserstein距离进行跨语言文档检索Introduction:许多信息检索算法都依赖于有效距离的概念,该距离可以有效地比较不同性质的对象。最近,提出了一种新的矩阵:Word Mover’s Distance,用于测量文本段落之间的差异。在本文中:提出两种扩展方法:1.在Word Mover’s Distance上融入词的权重2.在Word Mover’s Distanc...
2019-12-21 15:15:42
274
原创 基于双向注意模型的跨语言句子检索中的零样本语言转换
基于双向注意模型的跨语言句子检索中的零样本语言转换所提出的模型结合了具有双向注意层和句子内注意机制的递归序列编码器。这样,每个训练句子对中最终的固定大小句子表示 取决于从其他句子中选择上下文化的标记表示。然后使用双线性乘积函数组合两个句子的表示,以预测相关性得分。我们表明,结合共享的多语言单词嵌入空间,所提出的模型大大优于无监督的跨语言排名功能,并且可以通过结合两种方法来实现进一步的...
2019-12-13 19:55:28
379
原创 Cross-lingual Language Model Pretraining
跨语言语言模型构建共享词典通过bpe创建多语言共享的词典,极大地提高了嵌入空间的对齐。通过利用多项式分布从单语语料库中选择的句子群,利用句子群学习bpe因果关系建模训练一个Transformer模型在transformer中,之前迭代的隐状态可以传递到当前batch中的第一个词中,从而使得每一个batch中的第一个词具有上下文语义,但是在跨语言中不能实行,所以为了简便令每个batch中...
2019-12-08 15:56:20
557
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人