- 博客(2)
- 收藏
- 关注
原创 Dinomaly: The Less Is More Philosophy inMulti-Class Unsupervised Anomaly Detection
而对于线性注意力,是先计算φ(K)TV,这个是所有Ki和Vi的加权集合,计算的结果是φ(K)TV是dxd的全局聚合矩阵,在Q介入之前,所有的KV信息已经在全局上进行了整合(它的本质上是所有V的加权和,权重由φ(K)提供),而这个φ只是提供非负性,由于线性注意力的非聚焦性,使得线性注意力无法将权重集中在单个token身上也就是对角线不可能会远远大于非对角线,,也就是说破坏了A接近于单位矩阵这一过程,顺带一提,噪声瓶颈层是破坏了WV让接近单位矩阵这一过程,因为它让V有损地进入了解码器。
2025-11-15 18:15:36
840
原创 2025 CVPR INP-Former
2025年由清华和华科共同推出的关于异常检测方法:Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection(探索单张图像用于通用异常检测的内在正常原型)
2025-09-25 15:37:43
1128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅