- 博客(6)
- 收藏
- 关注
原创 swintransformer算法原理与代码debug
这需要划分成四个窗口和原来一样计算,在计算时,只需要计算自己窗口的,其他都是无关。位移就是像素点偏移,下图是偏移后先移动上面的到下面 ,后续则是左边到右边。,导致没有其他窗口之间的关系,容易模型局限在内部。(先做卷积得到特征图,对特征图做。重构,将窗口内部特征做好,整体特征也做好。这就得到跟输入特征图一样的大小,现在的。分层,也就是下采样操作,不同于池化(对。(为什么做下采样,因为窗口越来越少)得到,更改卷积实现不同大小的输入。,原来的窗口都是算自己内部的。偏移完,有个小问题,由原来。位置编码也是知道的。
2023-12-29 10:03:35 945 1
原创 BEVFormer的环境配置,依赖mmdetection3d-0.17.1
1.https://github.com/fundamentalvision/BEVFormer下载解压2.cdBEVFormer,下载解压https://github.com/open-mmlab/mmdetection3d/tree/v0.17.1(注意版本0.17.1)3.cd mmdetection3d-0.17.1,运行pip install -v -e .和pip install -r requirements(各别库的版本适配)4.在tran.py添加D:\code\BEVF
2023-12-29 09:34:36 681 1
原创 qt.qpa.xcb: could not connect to display
qt.qpa.xcb: could not connect to display的解决方案。1.安装合适的opencv-python的库。
2023-12-27 18:32:11 2087 1
翻译 Two-Stream Convolutional Networksfor Action Recognition in Videos——学习笔记
Two-Stream Convolutional Networksfor Action Recognition in Videos
2022-06-26 15:32:37 280
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人