![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 89
没头发的米糊
风浪未平息,我宣告奔跑的意义。
合肥工业大学2020级本科软件工程大四在读,已推免至中国科学技术大学信息学院,从事计算机视觉相关的课题研究。
主要技术栈:Java、Node.js、Python、C/C++、Rust、Kotlin
展开
-
【论文阅读】Generating Radiology Reports via Memory-driven Transformer (EMNLP 2020)
本文将记忆力机制引入到了端到端的放射性医学影像描述生成的任务重,从而确保了生成结果能够准确、详细地描述输入的影像,并且遵循常规的模式性的描述机制。在引入记忆力机制的过程中,其更改Transformer的结构的地方比较新颖,在LN层上动刀子,从而将记忆的影响带到了Decoder内部的隐层状态中,获得了更细粒度的控制。原创 2023-11-07 13:23:15 · 469 阅读 · 0 评论 -
【论文阅读】Progressive Spatio-Temporal Prototype Matching for Text-Video Retrieval
提出了一种新颖的文本视频检索框架,称为ProST,将匹配过程分解为互补的对象短语和事件句子原型对齐。在对象短语原型匹配阶段,设计了空间原型生成机制,以便专注于重要的视频内容并加强精细的空间对齐。在事件句子原型匹配阶段,他们使用时间原型生成机制逐渐生成多样化的事件原型,并学习动态的一对多关系。希望通过这篇论文不仅能够提供有关互补的时空匹配的重要性的见解,还能够促进未来的研究,通过解决设计缺陷而不是主要是尝试和错误来推动文本视频检索领域的进展。原创 2023-11-07 14:08:10 · 1289 阅读 · 1 评论