- 博客(48)
- 收藏
- 关注
原创 深度学习:Normalization
我个人理解,其实就是对卷积层的输出做一个正则化,但是这样可能缺乏灵活性实际效果不好,因此又添加了可学习的两个参数来以一种可学习的方式“恢复”。公式如下,对于神经网络的第l层,有其中m代表batch数,γ和β都是可学习的参数。训练时,会去计算每个batch的μ和σ,但在实际测试中中,μ和σ应该用的都是全局的,在训练时会以动量更新等方式进行更新。
2024-01-16 10:43:32 410 1
原创 pytorch:光流预测与grid_sample
最近在跑一个经典的光流估计的模型RAFT,我想用其预测出来的光流对输入的第一张图片进行warp,但是一直调不通。参考了网上许多教程之后终于搞明白了。
2023-12-14 15:41:28 655
原创 Python编程: contextlib.redirect_stdout 增加更多灵活性
这个可以将一些硬编码输出到标准输出的模块增加灵活性。可以通过上面的代码让原本输出到标准输出的cocoEval.summarize模块输出的信息,重定向到一个StringIO中。
2023-11-11 17:40:05 165
原创 论文阅读:Calibrating Uncertainty for Semi-Supervised Crowd Counting (ICCV 2023)
尽管利用不确定度估计以及在很多CV领域得到应用,但是由于人群分布的不均匀性以及人群的尺度变换、遮挡等因素的影响,不确定度在人群计数中仍然是一个挑战。有一些人群计数通过比较不同模型预测的一致性来估计不确定度(比如利用teacher-student模型),但是这些方法完全依赖于模型在未标注图片上的预测,并不能保证可靠性。其中M是匹配上的部分,计算的是匹配点之间的距离。本质上是在比较模型预测与GT之间的相似性,这种相似性是通过距离衡量的。下面的图感觉是数值越低不确定度,是通过直接比较密度图得到的不确定图。
2023-10-08 11:29:14 243
原创 论文写作表达摘录
when a higher quality and preservation of sharp shape features are required. (falls short: 赶不上)from MeshCNN (SIGGRAPH19)a combination of convolution, non-linearity and pooling layers (成功的窍门是以....为特点的) from MeshCNN (SIGGRAPH19)
2023-09-25 10:31:44 56
原创 CV工具:html4vision
在查看数据集图片时,需要经常查看多张图片,有时候还需要共享给别人。直接复制粘贴挺麻烦的,这时可以用这个非常nice的html5vision库。直接pip install就可以了。详细内容可以参考github链接的readme。
2023-08-04 14:11:07 270
原创 工具:tmux
在跑代码时经常需要监控多个终端,如果有很多个窗口的话会很影响心情。不过这个tmux似乎只能在Linux类操作系统上进行,windows下可能要借助wsl或者git bash进行。,此时tmux将打开一个会话列表,按上下键(⬆︎⬇︎)或者鼠标滚轮,可选中目标会话,按左右键(⬅︎➜)可收起或展开会话的窗口,选中目标会话或窗口后,按回车键即可完成切换。我目前是在window终端中ssh到服务器上,服务器上安装了tmux。因此我可以直接在终端上使用tmux。别担心,我们可以使用对应的tmux快捷键。
2023-07-20 14:45:09 65
原创 Pytorch笔记:关于MSELoss的用法
MSELoss的reduction参数有三个取值,分别是mean, sum和none,一直搞不太清楚,所以这里写个笔记记录一下。1. mean当reduction参数设置为mean时,会返回一个shape为[]的标量,其值是每个位置上元素的差的平方的和的均值。输出:2. sum当reduction参数设置为sum时,会返回一个shape为[]的标量,其值是每个位置上元素的差的平方的和的总和。输出:3. none当reduction参数设置为none时,保留原始维度
2023-04-09 23:12:59 607
原创 人群计数论文阅读:Leveraging Self-Supervision for Cross-Domain Crowd Counting
基于uncertainty及翻转分类的跨域自监督
2023-02-16 10:31:51 290
原创 Pytorch笔记:操作维度的permute、reshape/view、eniops
pytorch的permute和reshape/view的区别
2022-12-29 11:28:01 546
原创 Pytorch笔记:根据参数动态构造模型结构
在做实验时,经常要比较相似模型的不同结构对性能的影响。通过传递参数的方法可以很方便地构造出不同的模型结构,从而快速完成模型搭建的工作。
2022-12-28 10:42:17 257
原创 Python编程:安装自己编写的包
最近在跑人群计数代码时,有一些自己经常用到的代码,每次要用时再写一次总是很麻烦,所以想着把这部分常用的代码封装成库,以便于随时随地使用。
2022-12-26 15:26:46 456
原创 ML笔记:sklearn的k近邻与可视化
(第一行代码的括号里可以指定只寻找某些点的K紧邻。格式是[[x1,y1],...] )代码中的plt.annotate是标注文字,xy是标注的坐标,xytext是文字的坐标。indices: 离每个点最近的k个点的索引。
2022-12-11 16:38:13 247
原创 Python编程:基于multiprocessing的Pool的并行计算
之前做机器视觉任务处理图片时会遇到耗时较长的情况,当时就想着如果使用多进程应该能有提升。于是这里先做一个代码框架的记录,以后需要时再用上。
2022-12-10 17:57:23 721
原创 PyTorch笔记:修改模型中的某些权重参数
之前尝试复现MCNN,但由于这是16年的工作,现有的许多代码由于版本等各种各样的问题,所以我都跑不起来。在那些能跑起来的代码里又没有给权重,后来发现一个给了权重,但是确实.h5格式的,不能直接由Pytorch加载。而且里面参数名都有一个前缀DEM.,需要匹配前缀并且加载到模型中。
2022-12-10 16:31:04 1459 1
原创 PythonWeb开发:90分钟用Flask搭建博客
来自https://www.bilibili.com/video/BV1gh411q7xo?p=2&vd_source=54aa98683b2f8392aec4499961f896ce1. 环境准备1.1 搭建虚拟环境在项目文件夹下打开控制台,输入python -m venv myvenv就能新建一个叫做myvenv的虚拟环境。执行之后会在目录下看到一个myvenv的文件夹...
2022-12-03 11:16:00 479
原创 CV工具:可视化工具wandb(三) 实战
完整翻译文档效率太低,以后从实战入手记录重要的信息1. 代码示例import wandbconfig = dict ( learning_rate = 0.01, momentum = 0.2, architecture = "CNN", dataset_id = "peds-0192", infra = "AWS",)wandb.init( proje...
2022-12-03 11:16:00 132
原创 CV工具:可视化工具wandb(二)
https://docs.wandb.ai/guides/track/launchLaunch Experiments with wandb.init在代码最开始的地方,调用wandb.init()来初始化一个新的工作。这回在W&B中创建一个新的运行,还会启动一个数据来同步数据。On-Prem: 如果需要一个私有云或者本地实例,可以看self-hosted(链接在原文)Au...
2022-11-24 22:54:00 954
原创 CV工具:可视化工具wandb(一)实验跟踪 Experiment Tracking
实时追踪和可视化实验、比较baseline和快速迭代。参考自:https://docs.wandb.ai/guides/track1. 在代码中集成W&Bwandb.init():在代码的最开始初始化一次新的运行。此代码会返回一个Run对象,然后会创建一个本地的目录,这个目录里面存放所有的日志和文件,然后会异步地传输到W&B的服务器上。如果想要使用一个私有的服务器,也可...
2022-11-24 21:24:00 522
原创 CV笔记:卷积与转置卷积
1. 抽丝剥茧理解转置卷积:https://blog.csdn.net/tsyccnh/article/details/87357447阿斯顿2. 计算原理与API使用参考https://blog.csdn.net/qq_37541097/article/details/120709865转置卷积又叫反卷积、逆卷积。不过转置卷积是目前最为正规和主流的名称,因为这个名称更加贴切的描述了卷积...
2022-11-19 14:20:00 79
原创 Pytorch笔记:dataloader的collate_fn参数在加载数据集时的作用
1. 前言最近在复现MCNN时发现一个问题,ShanghaiTech数据集图片的尺寸不一,转换为tensor后的shape形状不一致,无法直接进行多batch_size的数据加载。经过查找资料,有人提到可以定义dataloader的collate_fn函数,在加载时将数据裁剪为最小的图片尺寸,以便于堆叠成多个batch_size。2. 代码2.1 数据集的定义dataset.pyi...
2022-11-11 10:20:00 639
原创 Python语法: *与**关于参数解包与参数传递
参考1. 写在函数定义里的*在许多地方常常会见到这样的写法:def calc(*nums): s = 0 for i in nums: s += i return s这里的*含义是将传入calc里所有的参数组装成一个元组。作用是方便调用的时候传递参数,否则如果想传入多个参数,那么首先还要组装成一个列表或者元组。2. 写在调用函数括号里的*例子:nums =...
2022-11-10 10:56:00 205
原创 图像处理:距离变换distance transform
引言在阅读Focal Inverse Distance Transform Maps for Crowd Localization这篇论文时看到了distance transform这个方法。以前没有了解过所以上午搜索了一下,然后发现这还是个挺有意思的方法,先记录下来,以后有用到了再继续完善参考自:https://pengzhang.blog.csdn.net/article/detail...
2022-11-09 09:26:00 954
原创 PyTorch笔记:hook的作用
参考自https://zhuanlan.zhihu.com/p/279903361,原始来自:https://towardsdatascience.com/how-to-use-pytorch-hooks-5041d777f904在Module官方文档那片笔记中已经有一部分关于hook的介绍了,但是这里的更为具体,更能让我体会到hook的作用1. 什么是钩子hook所谓钩子就是:特定事...
2022-11-05 21:08:00 168
原创 PyTorch笔记:如何保存与加载checkpoints
https://pytorch.org/tutorials/recipes/recipes/saving_and_loading_a_general_checkpoint.html保存和加载checkpoints很有帮助。为了保存checkpoints,必须将它们放在字典对象里,然后使用torch.save()来序列化字典。一个通用的PyTorch做法时使用.tar拓展名保存checkp...
2022-11-05 20:47:00 1346
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人