Nastu_Ho-小何同学-CSDN博客

原创 vscode个人配置

插件autoDocstring - Python Docstring Generator 、JSON ToolsJupyterMarkdown All in OnePylancePythonPython DebuggerBetter CommentsPalenight Themepython snippetsvscode-iconsssh设置自动保存禁止自动更新inline parameter hintseditor.inlayHints.enabled 开启鼠标

2024-03-22 12:12:10 602

原创【高效vscode】inline-parameters

方便直接查看函数所需的参数。

2024-03-22 10:44:50 266

原创 Visio无空白无黑边导出PDF

开发工具->显示ShapeSheet->页->将Print Properties中的Margin都设置为0。导出PDF->选项->取消勾选【辅助功能文档结构标记】->发布。文件->选项->自定义功能区->勾选开发工具。设计->大小->适应绘图。

2024-03-10 16:08:35 1085 1

原创【Latex小抄】

【代码】【Latex小抄】

2024-03-10 15:53:48 440

原创【知识储备】什么是python的GIL

Python的GIL锁，全称是Global Interpreter Lock，是CPython解释器中的一种机制，GIL通过限制同一时间只能有一个线程执行Python字节码，GIL通过在解释器级别上进行互斥锁来实现，这意味着。其次，GIL会增加Python程序的执行开销。首先，它限制了Python程序的并行性。，就有可能导致数据不一致或程序崩溃。

2024-03-09 16:26:40 403

原创【知识储备】Transformer为什么用LN而不用BN

Transformer为什么用LN而不用BN

2024-03-07 13:53:56 761

原创【知识储备】多头注意力机制的作用&为什么要多头

多头注意力机制的作用&为什么要多头多头注意力机制是对注意力机制的拓展，根据不同位置的上下文信息，为每个词分配不同的权重。它将隐状态向量分成多个头，每个头形成一个子语义空间。每个头可以关注不同维度的语义空间信息。这样，模型可以同时捕捉到不同类型的特征，丰富了模型的表达能力。比如，一个头可以关注词义，另一个头可以关注词性，再一个头可以关注词的位置等等。比如，不同的头会关注图像中不同的区域好处：多头注意力机制通过分割子语义空间，让模型可以关注不同维度的信息，从而提高了模型的表达能力和注意力

2024-03-07 13:47:13 1469

原创 [open-set, open-world, zero-shot learning, OOD,open-vocabulary]

open-set: 训练只用到已知类数据。希望测试时可以识别出已知类类和未知类（不继续做分类，已知类以外的类别通称为未知类）open-vocabulary：训练只用到已知类数据。测试时同时识别已知类和未知类，并对未知类进行区分。zero-shot learning:训练只用到已知类数据。测试时只识别未知类，并对未知类进行区分。参考：https://arxiv.org/pdf/2306.15880.pdf。OOD：训练的数据分布与测试的数据分布不一致。open-world：感觉跟增量学习相关。

2024-03-04 14:22:48 640

原创 opencv 转 PIL

此外，opencv返回的shape是[高，宽，通道]， PIL返回的size是[宽，高]。但opencv转pil时无需做shape的变换。

2024-02-22 13:44:48 558

原创指定长边大小并保持比例resize

【代码】指定长边大小并保持比例resize。

2024-02-22 13:34:45 372

原创注意pytorch的原地操作

常见的原地操作：nn.ReLu(inplace=True)如果没有clone, c则会变化。

2024-02-21 21:43:18 552

原创 Hugging Face使用常见问题

【代码】Hugging Face使用常见问题。

2024-02-19 09:37:47 410

原创解决--无法链接hugging face

import os。

2024-02-18 18:13:46 473

原创 linux 查看存储空间

df -h . 当前目录剩余空间。df -h 查看所有根路径磁盘情况。

2024-02-18 17:34:02 461

原创关于cuda路径问题

问题：Could not load dynamic library ‘libcudart.so.11.0’原因：调用系统环境下的cuda但系统环境没有装cuda。就会直接安装对应的cudatoolkit和cudnn。1.在系统环境装cuda，但如果每权限就不好操作；2.用虚拟环境装好的cuda路径丢给环境变量。export后再运行。

2024-02-18 16:07:47 548

原创 tar.gz 提取所有文件到当前目录

tar -zxf log.tar.gz --strip-components 1

2024-02-18 10:10:24 334

原创【SAM系列】RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentatio

论文代码：https://github.com/LancasterLi/RefSAM。特点：track token挺有意思，感觉可以用在一般语义分割用来迭代优化分割结果。论文链接：https://arxiv.org/pdf/2307.00997.pdf。

2023-12-31 14:47:23 441

原创【开放词汇系列】Exploring Open-Vocabulary Semantic Segmentation from CLIP Vision Encoder Distillation Only

方法：GroupViT通过层次化聚合图像表征得到segment tokens，文本表征为segment tokens提供监督。而这篇论文利用预训练好的VLM–CLIP，为了降低标注需求，通过将图片分成多个块送入CLIP image encoder得到表征来提供监督。目的：降低OV-Seg 任务所需的标注(像素标注, 图像级标注, captionl)

2023-12-29 09:10:31 477

原创【Loss系列】结合dice loss 和 bce loss

【代码】【Loss系列】结合dice loss 和 bce loss。

2023-12-28 17:43:58 1061

原创【医学图像系列】U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation

代码链接：https://github.com/yaoppeng/U-Net_v2/blob/master/unet_v2/UNet_v2.py。论文链接：https://arxiv.org/pdf/2311.17791.pdf。这里则是每个stage都会通过哈达玛积的方式复用编码器中所有stage的特征。过去的UNet在上采样的过程中每次通过拼接的方式复用一个stage的特征。在复用前会对编码器每个stage 串联通道、空间注意力做增强。

2023-12-28 17:30:42 793