Transformer
文章平均质量分 70
Taylor不想被展开
✓SDU PAMI Master's Degree Reading
✓Research Field: Deep Learning, Medical Image, Video Understanding
✓Message: 24h OFF-LINE
展开
-
【HuggingFace】Transformers-BertAttention逐行代码解析
本文基于Hugging Face的2.6.0版本Transformers包中的self-attention实现进行解析,不同版本间略有差异,但无伤大雅。原创 2023-04-14 15:58:55 · 886 阅读 · 2 评论 -
【CVPR 2023 论文解读】TriDet: Temporal Action Detection with Relative Boundary Modeling
TriDet: Temporal Action Detection with Relative Boundary Modeling原创 2023-04-04 19:32:01 · 2290 阅读 · 1 评论 -
【ACM MM 2022 论文解读】End-to-End Video Object Detection with Spatial-Temporal Transformers
本文提出了第一个基于spatial-temporal Transformer的端到端视频目标检测器TransVOD。简化当前VOD pipeline,有效地消除了许多手工制作的特征聚合组件,如光流模型、relation networks;得益于DETR中object query的设计,本文方法无需使用Seq-NMS等后处理方法。原创 2023-04-04 12:11:05 · 1260 阅读 · 1 评论 -
Attention Is All You Need笔记(3.2.3节)
Transformer论文笔记原创 2022-07-06 16:33:17 · 101 阅读 · 0 评论 -
Multi-Head Self-Attention里投影矩阵WQ/WK/WV是否共享的问题
刚从李宏毅老师的Transformer出来,弹幕里关于投影矩阵WQ/WK/WV是否共享已经吵翻,这里写一下自己的看法。原创 2022-07-06 10:44:39 · 1545 阅读 · 0 评论