论文笔记
文章平均质量分 92
KiraFenvy
华工学生一枚
展开
-
视频扩散模型介绍 Video Diffusion Models Introduction
扩散过程和去噪过程去噪器,预测出来噪声然后与原始图片相减,得到干净的图片当然,去噪过程是逐步的,所以减去之后会重新加上“平均噪声”跳步DDIM和DDPM作对比:原创 2024-03-05 15:21:03 · 1391 阅读 · 0 评论 -
CV及LLM常见名词解释
看论文的时候,有些术语虽然常见但是却让人很难理解具体含义,如noise等,这里是一些常见术语的解释,同时也给出了这些术语所在的上下文及模型。原创 2024-02-28 17:05:24 · 573 阅读 · 0 评论 -
论文编写思路
论文写作相关,科研小白入门原创 2024-02-27 13:32:28 · 835 阅读 · 0 评论 -
【Paper Note】Attention is all your need
Attention is all your need 的论文笔记原创 2023-04-08 15:35:55 · 1099 阅读 · 0 评论 -
【Paper】复现VideoMAE
VideoMAE: Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training论文复现注意事项原创 2023-06-27 02:46:25 · 1157 阅读 · 4 评论 -
【Paper】复现论文Prototypical Networks for Few-shot Learning
论文复现时的一些踩坑和经验原创 2023-06-23 17:38:23 · 885 阅读 · 0 评论 -
【踩坑】复现End-to-End Referring Video Object Segmentation with Multimodal Transformers
论文复现过程的一些踩坑原创 2023-06-22 03:59:36 · 325 阅读 · 0 评论 -
【Paper Note】Video Swin Transformer
Video Swin Transformer论文笔记原创 2023-04-19 16:30:28 · 603 阅读 · 0 评论 -
【Paper Note】ViViT: A Video Vision Transformer
ViViT论文阅读笔记原创 2023-04-17 12:15:07 · 758 阅读 · 0 评论 -
【Paper Note】Swin Transformer: Hierarchical ViT using Shifted Windows
Swin transformer笔记原创 2023-04-17 09:44:27 · 543 阅读 · 0 评论 -
【Paper Note】An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
视觉transformer文章An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale原创 2023-04-09 14:39:38 · 177 阅读 · 0 评论