自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 关于计算机图像的一些先验知识

以下图片与部分结论来自论文"Why You Should Forget Luminance Conversion and Do Something Better, Rang M. H. Nguyen, Michael S. Brown, CVPR2017"

2024-06-11 23:12:38 735

原创 epoch和iteration的区别

进行一次前向和后向传播。在一个 epoch 中会有多个 iterations,其数量取决于训练集的大小和批次大小。假设训练数据集有 1000 个样本,批次大小为 100。:一个 epoch 完成时意味着网络已经使用了。这包括对所有批次的多次迭代。:一次 iteration 是指对训练数据的。

2024-01-11 21:07:31 1053

原创 Information Maximization (IM) loss

再把各样本分类概率(64,9)按列求均值后,得到每个类别的平均预测概率(9,)因此每个概率综合不同样本概率(多样性)即整个batch的平均输出的熵。,将classifier feature softmax (64,9),对每个样本计算entropy,加和后取期望值,得到。分类任务,设output.size为(64,9)即batch-size 64,num-classes 9。对每个单独的样本给出确定性的预测,而且在所有样本上给出均衡的预测(增加多样性)。可以理解为个体entropy loss,

2024-01-10 21:53:25 482

原创 torchvision.transforms用法及图片增强方法

在 PyTorch 的 `torchvision.transforms` 中,大多数变换都是设计为应用于PIL 图像格式的。

2023-12-27 21:38:58 1735 1

原创 目标检测相关

它的主要作用是减少重叠的边界框数量,保留最佳的边界框,并去除那些较不重要的边界框。3. **计算重叠程度**:计算其他所有边界框与参考框的重叠程度,通常通过计算它们的交并比(Intersection over Union, IoU)。4. **去除重叠边界框**:如果一个边界框与参考框的IoU超过了预设的阈值(表示它们重叠得太多),则这个边界框会被去除。5. **重复过程**:从剩下的边界框中再次选择置信度最高的框作为新的参考框,并重复上述过程,直到所有的边界框都被处理过。

2023-12-05 21:38:34 1236

原创 常用的Loss & Distance (& Similarity)

多用于分类任务中。交叉熵是衡量两个概率分布之间的“距离”或相似性的度量。对于真实概率分布 p 和模型预测的概率分布 q,交叉熵定义为:x 是可能的事件或类别,p(x) 是真实概率,q(x) 是模型的预测概率。在机器学习的分类问题中,真实的类别通常用一个"one-hot"编码的向量来表示,其中只有一个位置是1(代表正确的类别),其他位置都是0。而模型的输出则是一个概率分布,表示每个类别的预测概率。对于二分类任务:对于多分类任务:,其中是label的是。交叉熵损失对模型的错误预测给予了高的惩罚。

2023-10-02 14:57:43 234 1

原创 SINKHORN && 二次分配问题等

对于问题的每一个正面答案(即答案为 "是"),如果存在一个多项式时间算法,该算法可以验证一个提供的证据(或解)是否正确,那么这个问题就属于 NP 类。

2023-09-30 15:09:04 465 1

原创 pytorch basic(二)detach&contiguous&切片

返回一个新的tensor,从当前计算图中分离下来的,但是仍指向原变量的存放位置(当一个被修改,另一个也会修改),不同之处只是requires_grad为false,得到的这个tensor永远不需要计算其梯度,不具有grad。即在网络训练过程中希望某些变量的参数不保持更新,切断一些分支的反向传播。

2023-07-29 16:28:30 117 1

原创 functools

Partial为函数的参数提供默认值。

2023-07-28 17:24:42 36 1

原创 RAW图像

在SID数据集中,x0001_00_0.1s.png: x=0为训练集,x=1为test set, x=2为验证集。

2023-07-26 10:50:34 67 1

原创 制作Dataset,生成Burst

code from Dudhane, Akshay, Syed Waqas Zamir, Salman Khan, Fahad Shahbaz Khan和Ming-Hsuan Yang. 《Burstormer: Burst Image Restoration and Enhancement Transformer》. arXiv, 2023年4月3日.

2023-07-22 14:34:54 195

原创 相机先验知识

在相机成像系统中,将场景亮度(scene radiance)与图像强度(image intensity)联系起来的函数称为相机响应。

2023-07-18 18:50:38 101 1

原创 机器学习基础(用去噪方法理解监督学习种类)

可视为无监督学习,标注信息都来自于数据自身。不给样本,而是给出一个代表某一类物体语义的embedding。部分,而zero-shot在模型重在模型训练好后的下游task。:已知数据没有任何标签,将所有数据映射到不同标签。:大量未标记数据和少量标签数据。:数据与标记有一一对应的关系。

2023-06-15 20:41:51 269 1

原创 Padding picture

Jin, Xin, Ling-Hao Han, Zhen Li, Chun-Le Guo, Zhi Chai和Chongyi Li. 《DNF: Decouple and Feedback Network for Seeing in the Dark》, CVPR2023.stride由Unet架构的层级数layers决定,layers=4,stride = 8。当输入图片h=w=233,由上式 上下填充7值h=w=240.关键步骤:dh = -h % stride,dw = -w % stride。

2023-06-12 20:24:53 266 1

原创 Progressive learning

True 结果为[True, True, True, True, True, True],则nozero返回(array([0,1,2,3,4,5]),) ,nozero[0] = [0,1,2,3,4,5].在小的crop patches上训练Transformer模型可能无法对全局图像统计进行编码,从而在测试时对全分辨率图像的效果不佳。网络在早期的时代在较小的图像patch上进行训练,在后期的训练时代在逐渐变大的patch上进行训练。sequence: 可以是一个列表,元组,字符串,或集合。

2023-06-12 20:14:47 286 1

原创 Pytorch DataLoader

因为当shuffle == False,sampler是SequentialSampler,就是按顺序取样。当shuffle == True,sampler是RandomSampler, 就是按随机取样。当sampler有输入时,参数shuffle的值没有意义。

2023-06-12 17:58:53 54 1

原创 Pytorch basic function

对张量分块,返回一个张量列表

2023-06-09 15:16:44 53

原创 python基础函数&用法&报错

对两个可迭代对象同一位置打包,返回为tuple。如果几个参数不等长,取最短的那个参数的长度,舍弃超出最短长度的成员。

2023-06-08 14:10:20 47 1

原创 卷积Conv

如有小数,向下取整。

2023-06-07 21:06:50 288

原创 fvcore basic

fvcore是一个易用的工具。fvcore是Facebook开源的一个轻量级的核心库,它提供了各种计算机视觉框架中常见且基本的功能。其中就包括了统计模型的参数以及FLOPs等。

2023-06-07 20:34:08 312

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除