- 博客(138)
- 收藏
- 关注
原创 vscode个人配置
插件autoDocstring - Python Docstring Generator 、JSON ToolsJupyterMarkdown All in OnePylancePythonPython DebuggerBetter CommentsPalenight Themepython snippetsvscode-iconsssh设置自动保存禁止自动更新inline parameter hintseditor.inlayHints.enabled 开启鼠标
2024-03-22 12:12:10 602
原创 Visio无空白无黑边导出PDF
开发工具->显示ShapeSheet->页->将Print Properties中的Margin都设置为0。导出PDF->选项->取消勾选【辅助功能文档结构标记】->发布。文件->选项->自定义功能区->勾选开发工具。设计->大小->适应绘图。
2024-03-10 16:08:35 1085 1
原创 【知识储备】什么是python的GIL
Python的GIL锁,全称是Global Interpreter Lock,是CPython解释器中的一种机制,GIL通过限制同一时间只能有一个线程执行Python字节码,GIL通过在解释器级别上进行互斥锁来实现,这意味着。其次,GIL会增加Python程序的执行开销。首先,它限制了Python程序的并行性。,就有可能导致数据不一致或程序崩溃。
2024-03-09 16:26:40 403
原创 【知识储备】多头注意力机制的作用&为什么要多头
多头注意力机制的作用&为什么要多头多头注意力机制是对注意力机制的拓展,根据不同位置的上下文信息,为每个词分配不同的权重。它将隐状态向量分成多个头,每个头形成一个子语义空间。每个头可以关注不同维度的语义空间信息。这样,模型可以同时捕捉到不同类型的特征,丰富了模型的表达能力。比如,一个头可以关注词义,另一个头可以关注词性,再一个头可以关注词的位置等等。比如,不同的头会关注图像中不同的区域好处:多头注意力机制通过分割子语义空间,让模型可以关注不同维度的信息,从而提高了模型的表达能力和注意力
2024-03-07 13:47:13 1469
原创 [open-set, open-world, zero-shot learning, OOD,open-vocabulary]
open-set: 训练只用到已知类数据。希望测试时可以识别出已知类类和未知类(不继续做分类,已知类以外的类别通称为未知类)open-vocabulary:训练只用到已知类数据。测试时同时识别已知类和未知类,并对未知类进行区分。zero-shot learning:训练只用到已知类数据。测试时只识别未知类,并对未知类进行区分。参考:https://arxiv.org/pdf/2306.15880.pdf。OOD:训练的数据分布与测试的数据分布不一致。open-world:感觉跟增量学习相关。
2024-03-04 14:22:48 640
原创 opencv 转 PIL
此外,opencv返回的shape是[高,宽,通道], PIL返回的size是[宽,高]。但opencv转pil时无需做shape的变换。
2024-02-22 13:44:48 558
原创 关于cuda路径问题
问题:Could not load dynamic library ‘libcudart.so.11.0’原因:调用系统环境下的cuda但系统环境没有装cuda。就会直接安装对应的cudatoolkit和cudnn。1.在系统环境装cuda,但如果每权限就不好操作;2.用虚拟环境装好的cuda路径丢给环境变量。export后再运行。
2024-02-18 16:07:47 548
原创 【SAM系列】RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentatio
论文代码:https://github.com/LancasterLi/RefSAM。特点:track token挺有意思,感觉可以用在一般语义分割用来迭代优化分割结果。论文链接:https://arxiv.org/pdf/2307.00997.pdf。
2023-12-31 14:47:23 441
原创 【开放词汇系列】Exploring Open-Vocabulary Semantic Segmentation from CLIP Vision Encoder Distillation Only
方法:GroupViT通过层次化聚合图像表征得到segment tokens,文本表征为segment tokens提供监督。而这篇论文利用预训练好的VLM–CLIP,为了降低标注需求,通过将图片分成多个块送入CLIP image encoder得到表征来提供监督。目的:降低OV-Seg 任务所需的标注(像素标注, 图像级标注, captionl)
2023-12-29 09:10:31 477
原创 【医学图像系列】U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation
代码链接:https://github.com/yaoppeng/U-Net_v2/blob/master/unet_v2/UNet_v2.py。论文链接:https://arxiv.org/pdf/2311.17791.pdf。这里则是每个stage都会通过哈达玛积的方式复用编码器中所有stage的特征。过去的UNet在上采样的过程中每次通过拼接的方式复用一个stage的特征。在复用前会对编码器每个stage 串联通道、空间注意力做增强。
2023-12-28 17:30:42 793
原创 【医学图像系列】U-Net: Convolutional Networks for Biomedical Image Segmentation
特点:通过拼接的方式将浅层的与深层特征做融合,补充深层特征丢失的low-level信息。论文链接:https://arxiv.org/pdf/1505.04597.pdf。
2023-12-28 17:08:53 362
原创 【SAM系列】SAM-Assisted Remote Sensing Imagery Semantic Segmentation with Object and Boundary Constraint
论文链接:https://arxiv.org/pdf/2312.02464v2.pdf。代码链接:https://github.com/sstary/SSRS。核心:利用SAM为 遥感分割模型的训练提供额外的监督。
2023-12-27 23:06:57 418
原创 【SAM系列】I-MedSAM: Implicit Medical Image Segmentation with Segment Anything
论文链接:https://arxiv.org/abs/2311.17081。比较有趣的点:frequency adapter。
2023-12-27 23:01:50 501
原创 【SAM系列】SAMIHS: Adaptation of Segment Anything Model for Intracranial Hemorrhage Segmentation
finetune SAM,image encoder加上adapter,prompt encoder和mask decoder 完全finetune;论文链接:https://arxiv.org/abs/2311.08190。
2023-12-27 22:57:13 413
原创 【SAM系列】Auto-Prompting SAM for Mobile Friendly 3D Medical Image Segmentation
论文链接:https://arxiv.org/pdf/2308.14936.pdf。
2023-12-27 22:53:08 935 1
原创 Self-Prompt SAM: Automatic Prompt SAM Adaptation for Medical Image Segmentation
核心点:通过中间预测的mask 来得到mask、point、box prompt,以实现不依赖外部手工prompt。论文链接:https://openreview.net/forum?
2023-12-27 22:45:38 418
原创 【SAM系列】Relax Image-Specific Prompt Requirement in SAM
代码链接:https://github.com/jyLin8100/GenSAM。论文链接:https://arxiv.org/abs/2312.07374。有关联的工作:clip-surgery,clims,qa-clims。特点:training-free;
2023-12-27 21:54:02 985
原创 【SAM系列】SqueezeSAM: User-Friendly Mobile Interactive Segmentation
论文链接:https://arxiv.org/abs/2312.06736。目的:轻量化SAM,使其可以在移动设备上运行。
2023-12-27 21:15:25 443
原创 【SAM系列】EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything
论文代码:https://github.com/yformer/EfficientSAM。论文链接:https://web3.arxiv.org/abs/2312.00863。目的:降低SAM的计算开销。
2023-12-27 20:26:33 647
原创 【SAM系列】Segment Anything--prompt具体如何起作用
【代码】【SAM系列】Segment Anything--prompt具体如何起作用。
2023-12-27 20:03:27 715
原创 【Leetcode】旋转矩阵
题目链接:https://leetcode.cn/problems/rotate-matrix-lcci/description/
2023-12-18 15:37:07 146
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人