- 博客(3)
- 收藏
- 关注
原创 论文笔记:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context
前言论文链接:https://www.aclweb.org/anthology/P19-1285/github:https://github.com/kimiyoung/transformer-xl目前在NLP领域中,处理语言建模问题有两种最先进的架构:RNN和Transformer。RNN按照序列顺序逐个学习输入的单词或字符之间的关系,而Transformer则接收一整段序列,然后使用self-attention机制来学习它们之间的依赖关系。这两种架构目前来看都取得了令人瞩目的成就,但它们都局限在捕
2020-08-23 18:11:05 617
原创 论文笔记:LightGCN Simplifying and Powering Graph Convolution Network for Recommendation
前言论文链接:https://arxiv.org/abs/2002.02126github:https://github.com/gusye1234/LightGCN-PyTorch参考:https://blog.csdn.net/qq_39388410/article/details/106970194https://blog.csdn.net/u013422128/article/details/107504654图卷积网络(GCN)已经成为协同过滤的最新技术。然而,对于推荐的有效性的原因却没
2020-08-14 13:35:37 1665 1
原创 NLP-NMT-Transformer图解及论文笔记:Attention Is All You Need
前言机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机运算能力的提升和多语言信息资源的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。Attention机制最早在视觉领域提出,2014年Google Mind发表了《Recurrent Models of Visual Attention》,使Attention机制流行起来,这篇论文采用了RNN模型,并加入了A
2020-08-13 17:20:53 1287
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人