![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
表示学习
无声云泪
Think. Change. Do.
展开
-
小评最近很火的BERT模型
应Pattern Recognition审稿人要求,加入最近很火的BERT模型作为我们提出的文本表示模型的对比方法。在此和大家共同学习分析一下最近深度学习在自然语言处理领域的网红模型BERT,尝试品味BERT的精髓,探讨BERT可能的应用的改进方向。模型小解BERT模型全名是Bidirectional Encoder Representations from Transformers. 翻译过...原创 2019-04-04 14:06:54 · 6770 阅读 · 1 评论 -
解读表示学习中的自适应计算时间 Adaptive Computation Time (ACT)
最近在学习网红模型Universal Transformers时接触到了自适应计算时间(Adaptive Computation Time, ACT)这个新奇的算法。查了一下,这个算法其实并不算新,2016年就被Google DeepMind组的Alex Graves在论文《Adaptive Computation Time for Recurrent Neural Networks》中提出。但是...原创 2019-04-07 10:17:42 · 3159 阅读 · 5 评论