论文阅读笔记
文章平均质量分 92
Deserve_p
这个作者很懒,什么都没留下…
展开
-
EDTER:融合transformer的边缘检测网络
这块把global context作为先验知识,调制local context(既然前者作为先验知识,且目标是全局信息更好,能不能用显著性等数据集训练。或者有什么其他办法能更关注全局,我目前认为他的全局只在于输入更粗)包括一个spatial feature transform block和两个卷积层。前者为了调制lcoal context,后者为了平滑。得到的输出再输入给一个lcoal decision head(1*1卷积+sigmoid 函数),输出edge map。原创 2024-01-30 16:23:30 · 958 阅读 · 0 评论 -
Boundry attention: 泛化能力很强的边缘检测模块
本文提出的模型泛化性好,即使只在合成的图案简单的图片上训练,在复杂的真实图上做检测也能得到较好的边界。细节部分:不同于viT把图片切成小patch,然后映射为token,而是每个像素都有一个token。(文章说的dense,stride-1的token)每个像素的token,设计为表达局部几何结构的特征空间,表征以自己为中心的正方形区域内的局部结构。提出bottleneck:将图像的token映射到低维空间,这里设计这个空间为。原创 2024-01-30 14:36:45 · 1189 阅读 · 0 评论