喜欢吃饭和睡觉-CSDN博客

原创视频分类模型汇总

稀疏局部全局注意力机制(L+G)：先利用所有帧中，相令的H/2和W/2的图像块计算局部的注意力，然后在空间上，使用2个图像块的步长，在整个序列中计算自注意力机制，这个可以看做全局的时空注意力更快的近似。轴向的注意力机制(T+W+H)：先在时间维度上进行自注意力机制，然后在纵坐标相同的图像块上进行自注意力机制，最后在横坐标相同的图像块上进行自注意力机制。缺点：参数量大难训练，所以一般3D网络的深度都较浅，但这样影响了模型的表达能力，而且不能有效的把2D网络的预训练权重迁移到3D网络。

2026-03-16 12:45:27 354

原创解决git clone 超时问题

重新git clone就可以啦。

2026-02-03 15:33:47 209 2

原创图像数据增强策略

当数据量较少时，模型容易记住训练集特征。增强引入了噪声和变化，迫使模型学习更鲁棒的特征。模拟真实场景中可能出现的光照、角度、遮挡等变化，让模型在未见过的测试数据上表现更好。

2026-01-19 13:54:55 612

原创 BN和Droupout在训练和测试时的差别

假设失活概率为 p ，就是这一层中的每个神经元都有p的概率失活，如下图的三层网络结构中，如果失活概率为0.5，则平均每一次训练有3个神经元失活，所以输出层每个神经元只有3个输入，而实际测试时是不会有dropout的，输出层每个神经元都有6个输入，这样在训练和测试时，输出层每个神经元的输入和的期望会有量级上的差异。对于BN，是对每一批数据进行归一化到一个相同的分布，而每一批数据的均值和方差会有一定的差别，而不是用固定的值，这个差别实际上也能够增加模型的鲁棒性，也会在一定程度上减少。测试时 (Testing)

2026-01-19 13:45:12 659

原创编程中常用的代码缩写总结

- 结果/答案 - 结果 - 临时变量 - 值 - 变量 - 参数 - 参数 - 返回值。

2026-01-05 15:21:26 814

原创 Python 常用函数大全

【代码】Python 常用函数大全。

2025-12-19 10:11:01 577

原创 defaultdict详解

KeyError。

2025-12-17 14:07:04 378

原创 zip函数详解

zip()是 Python 中一个非常实用的内置函数，用于将多个可迭代对象（如列表、元组、字符串等）的元素配对组合。

2025-12-17 10:34:55 141

原创大模型生成复杂公式，如何完美渲染进Word文档?pasteMD插件，github开源

网址:https://github.com/RICHQAQ/PasteMD。

2025-12-12 16:24:24 328

原创 linux常用指令

写这个最初的目的是为了我用着方便，会持续更新，有错误请指正。

2025-11-17 14:53:11 104

原创 linux/windows安装docker

打开virtual machine platform和适用于Linux的windows子系统功能。下载完成之后直接运行即可,在终端输入：docker --version。把下面的命令添加在false之后，注意需要在false之后先打一个,号。windows需要打开docker的Docker Engine选项。在windows使用docker需要一直打开docker界面。windows打开启动或关闭windows功能。linux访问这个网站跟着上面的教程即可。如果可以看到版本号说明下载成功。

2025-11-17 12:05:58 384

原创 linux安装mamba-ssm和causal-conv1d

文件，环境中装的是Python 3.8、PyTorch 2.2.2 和 CUDA 11.8。安装适用于 CUDA 11.8 的 PyTorch 2.2.2 版本。1.用conda创建一个Python 3.8 虚拟环境。3.安装 GPU 版本的 PyTorch。，选择与你的环境兼容的。

2025-11-14 11:25:53 284

原创什么是RoPE (Rotary Position Embedding) - 旋转位置编码

旋转位置编码是一种非常巧妙的、用于Transformer架构中的位置编码方法。它由苏剑林等人提出，并因其卓越的性能（尤其是在长序列建模中）而被广泛应用于如LLaMA、ChatGLM等大型语言模型。首先，我们需要理解为什么需要位置编码。原始的Transformer模型的核心——自注意力机制——本身是的。这意味着它处理序列“[A, B, C]”和“[B, A, C]”时，如果不提供额外信息，它无法区分两者的顺序差异。位置编码就是向模型注入每个词在序列中的。

2025-11-13 17:04:38 1435

原创 ADE20K分割数据集使用教程

objectInfo150.txt对应150类的类别标号，名称和各自所占的比例。3.上面的是语义分割数据集，下面的是实例分割数据集。2.进入官网后点这个。

2025-11-13 10:40:44 313

原创深度学习中常用到的矩阵变换操作，reshape，transpose，permute，view，squeeze和 unsqueeze

是 PyTorch 中特有的方法，NumPy 中没有直接对应的方法。只在pytorch中有，numpy没有此操作，是transpose。numpy和pytorch都有此操作，改变数组的。但是view 要求张量在内存中是连续的。参数，可以精确控制每个轴的新位置。对于 N 维数组，如果不指定。可以任意重新排列所有轴。会反转所有轴的顺序。

2025-11-10 19:00:06 196

原创什么是MIOU

mIoU（Mean Intersection over Union）是，是语义分割、实例分割等任务中最核心的评价指标，用来衡量模型预测结果与真实标签的：模型预测为某类的区域，与真实标签中该类区域的重叠部分。：模型预测为某类的区域，与真实标签中该类区域的总覆盖范围（包含重叠和非重叠部分）。

2025-11-07 12:57:19 620

原创激活函数图像

Softmax 函数能将多个输入值映射为一组和为 1 的概率值，常用于多分类任务的输出层，直接对应属于每个类别的概率。

2025-11-04 10:29:46 439

原创 python中@的作用

在 Python 中，`@` 符号主要用于装饰器（Decorator）的语法糖，用来简化装饰器的调用方式。装饰器是一种特殊的函数，它可以用来修改其他函数的功能，而无需改变被修饰函数的源代码。`@` 符号的作用是将其下方的函数作为参数传递给 `@` 后面的装饰器函数。

2025-10-27 10:11:30 375

m0_63090136的博客