自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 视频分类模型汇总

稀疏局部全局注意力机制(L+G):先利用所有帧中,相令的H/2和W/2的图像块计算局部的注意力,然后在空间上,使用2个图像块的步长,在整个序列中计算自注意力机制,这个可以看做全局的时空注意力更快的近似。轴向的注意力机制(T+W+H):先在时间维度上进行自注意力机制,然后在纵坐标相同的图像块上进行自注意力机制,最后在横坐标相同的图像块上进行自注意力机制。缺点:参数量大难训练,所以一般3D网络的深度都较浅,但这样影响了模型的表达能力,而且不能有效的把2D网络的预训练权重迁移到3D网络。

2026-03-16 12:45:27 354

原创 解决git clone 超时问题

重新git clone就可以啦。

2026-02-03 15:33:47 209 2

原创 图像数据增强策略

当数据量较少时,模型容易记住训练集特征。增强引入了噪声和变化,迫使模型学习更鲁棒的特征。模拟真实场景中可能出现的光照、角度、遮挡等变化,让模型在未见过的测试数据上表现更好。

2026-01-19 13:54:55 612

原创 BN和Droupout在训练和测试时的差别

假设失活概率为 p ,就是这一层中的每个神经元都有p的概率失活,如下图的三层网络结构中,如果失活概率为0.5,则平均每一次训练有3个神经元失活,所以输出层每个神经元只有3个输入,而实际测试时是不会有dropout的,输出层每个神经元都有6个输入,这样在训练和测试时,输出层每个神经元的输入和的期望会有量级上的差异。对于BN,是对每一批数据进行归一化到一个相同的分布,而每一批数据的均值和方差会有一定的差别,而不是用固定的值,这个差别实际上也能够增加模型的鲁棒性,也会在一定程度上减少。测试时 (Testing)

2026-01-19 13:45:12 659

原创 编程中常用的代码缩写总结

​ - 结果/答案​ - 结果​ - 临时变量​ - 值​ - 变量​ - 参数​ - 参数​ - 返回值。

2026-01-05 15:21:26 814

原创 Python 常用函数大全

【代码】Python 常用函数大全。

2025-12-19 10:11:01 577

原创 defaultdict详解

KeyError。

2025-12-17 14:07:04 378

原创 zip函数详解

zip()是 Python 中一个非常实用的内置函数,用于将多个可迭代对象(如列表、元组、字符串等)的元素配对组合。

2025-12-17 10:34:55 141

原创 大模型生成复杂公式,如何完美渲染进Word文档?pasteMD插件,github开源

网址:https://github.com/RICHQAQ/PasteMD。

2025-12-12 16:24:24 328

原创 linux常用指令

写这个最初的目的是为了我用着方便,会持续更新,有错误请指正。

2025-11-17 14:53:11 104

原创 linux/windows安装docker

打开virtual machine platform和适用于Linux的windows子系统功能。下载完成之后直接运行即可,在终端输入:docker --version。把下面的命令添加在false之后,注意需要在false之后先打一个,号。windows需要打开docker的Docker Engine选项。在windows使用docker需要一直打开docker界面。windows打开启动或关闭windows功能。linux访问这个网站跟着上面的教程即可。如果可以看到版本号说明下载成功。

2025-11-17 12:05:58 384

原创 linux安装mamba-ssm和causal-conv1d

文件,环境中装的是Python 3.8、PyTorch 2.2.2 和 CUDA 11.8。安装适用于 CUDA 11.8 的 PyTorch 2.2.2 版本。1.用conda创建一个Python 3.8 虚拟环境。3.安装 GPU 版本的 PyTorch。,选择与你的环境兼容的。

2025-11-14 11:25:53 284

原创 什么是RoPE (Rotary Position Embedding) - 旋转位置编码

旋转位置编码是一种非常巧妙的、用于Transformer架构中的位置编码方法。它由苏剑林等人提出,并因其卓越的性能(尤其是在长序列建模中)而被广泛应用于如LLaMA、ChatGLM等大型语言模型。首先,我们需要理解为什么需要位置编码。原始的Transformer模型的核心——自注意力机制——本身是的。这意味着它处理序列“[A, B, C]”和“[B, A, C]”时,如果不提供额外信息,它无法区分两者的顺序差异。位置编码就是向模型注入每个词在序列中的。

2025-11-13 17:04:38 1435

原创 ADE20K分割数据集使用教程

objectInfo150.txt对应150类的类别标号,名称和各自所占的比例。3.上面的是语义分割数据集,下面的是实例分割数据集。2.进入官网后点这个。

2025-11-13 10:40:44 313

原创 深度学习中常用到的矩阵变换操作,reshape,transpose,permute,view,squeeze和 unsqueeze

是 PyTorch 中特有的方法,NumPy 中没有直接对应的方法。只在pytorch中有,numpy没有此操作,是transpose。numpy和pytorch都有此操作,改变数组的。但是view 要求张量在内存中是连续的。参数,可以精确控制每个轴的新位置。对于 N 维数组,如果不指定。可以任意重新排列所有轴。会反转所有轴的顺序。

2025-11-10 19:00:06 196

原创 什么是MIOU

mIoU(Mean Intersection over Union)是,是语义分割、实例分割等任务中最核心的评价指标,用来衡量模型预测结果与真实标签的:模型预测为某类的区域,与真实标签中该类区域的重叠部分。:模型预测为某类的区域,与真实标签中该类区域的总覆盖范围(包含重叠和非重叠部分)。

2025-11-07 12:57:19 620

原创 激活函数图像

Softmax 函数能将多个输入值映射为一组和为 1 的概率值,常用于多分类任务的输出层,直接对应 属于每个类别的概率。

2025-11-04 10:29:46 439

原创 python中@的作用

在 Python 中,`@` 符号主要用于装饰器(Decorator)的语法糖,用来简化装饰器的调用方式。装饰器是一种特殊的函数,它可以用来修改其他函数的功能,而无需改变被修饰函数的源代码。`@` 符号的作用是将其下方的函数作为参数传递给 `@` 后面的装饰器函数。

2025-10-27 10:11:30 375

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除