![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 52
写进メ诗的结尾。
这个作者很懒,什么都没留下…
展开
-
IoU 及 NMS 的计算
【代码】IoU 及 NMS 的计算。原创 2024-06-18 11:50:58 · 180 阅读 · 0 评论 -
ResNet-18
由于第 2、3、4 个 layer 的第 1 个 block 会进行下采样,因此这些 block 的输入在进行残差连接时,会进行一次步长为 2 的 1*1 卷积,以保证进行残差连接的 block 输入在通道数和特征图大小方面都与输出一致。第 1 个 layer 没有下采样,其他 3 个 layer 中的第 1 个 block 的第 1 个卷积层会进行一次下采样(即 stride=2);此外,模型的第一个卷积层会进行一次下采样,并有一个最大池化层也会进行一次下采样;原创 2024-06-05 16:06:05 · 329 阅读 · 0 评论 -
卷积神经网络中间层特征图的可视化
如果 PIL Image 属于 (L, LA, P, I, F, RGB, YCbCr, RGBA, CMYK, 1) 中的一种图像类型,或者 numpy.ndarray 的数据类型是 np.uint8,则将像素值从 [0, 255] 归一化到 [0.0, 1.0],这是通过将每个像素值除以 255 来实现的;图片经过 ReLU 层后,得到的特征图大小为:torch.Size([1, 8, 960, 960])图片经过卷积层后,得到的特征图大小为:torch.Size([1, 8, 960, 960])原创 2024-05-21 15:39:03 · 321 阅读 · 0 评论 -
Anaconda镜像源
各系统都可以通过修改用户目录下的 .condarc 文件来使用 TUNA 镜像源。Windows 用户无法直接创建名为 .condarc 的文件,可先执行 conda config --set show_channel_urls yes 生成该文件之后再修改。除了上述常用镜像源外,还有其他如上海交通大学、南京大学、西安交通大学、南方科技大学、上海科技大学等镜像源,可自行搜索。清除索引缓存,保证用的是镜像站提供的索引。原创 2023-07-19 14:24:53 · 362 阅读 · 0 评论 -
使用OpenCV读取若干视频,并将它们进行逐帧拼接,再输出为视频
循环,直到其中任意一个视频读取完毕才退出循环。这是因为,如果其中任意一个视频比其他视频更长,那么在拼接视频时就需要保证所有视频的帧数相同。在处理视频时,还需要注意释放资源,以避免内存泄漏。函数获取了这些视频的帧率、宽度和高度,以便在创建输出视频时使用。函数从三个输入视频中分别读取一帧,并将这三帧使用。需要注意的是,我们在处理输入视频时,使用了一个。,并指定了输出视频的格式、帧率和大小。在逐帧读取输入视频时,我们使用。函数将拼接后的帧写入输出视频。函数分别读取了三个输入视频。在这个程序中,我们首先使用。原创 2023-05-12 15:07:57 · 1085 阅读 · 0 评论 -
使用chatGPT写的IoU及IoU变体的代码实现
Intersection over Union(IoU)是计算两个边界框的重叠程度的常用指标。这些变体都是用于计算两个边界框的重叠度量,目的是为了提高目标检测等任务的精度。在实际应用中,我们可以根据任务的需要选择适当的重叠度量。原创 2023-05-07 12:01:31 · 586 阅读 · 0 评论 -
conda命令
在使用conda命令下载安装包时,会默认使用conda源下载。但是,由于不可描述的原因,可能会导致安装包的下载速度极其缓慢,甚至出现下载中断的情况。在创建虚拟环境时,如无必要,尽量不要选择最新的python版本,以确保后续配置或安装包不会出现python版本不支持的情况。如果使用某个镜像源下载速度慢,可尝试切换不同的镜像源,比如有时候使用清华源下载速度只有10k,切换成豆瓣源速度能达到2M多;如果使用pip命令安装提示找不到相关库,可切换使用conda命令安装;原创 2023-04-26 20:19:07 · 799 阅读 · 0 评论 -
ImageNet的均值和标准差
因为mean=[0.485, 0.456, 0.406]和std=[0.229, 0.224, 0.225]是根据ImageNet数据集中的数百万张图像计算得到的,而使用ImageNet的均值和标准差是训练模型时的一种常用方法。这是数值范围在[0, 1]的图像的均值和标准差,对于[0, 255]的输入,用mean=(0.485, 0.456, 0.406)*255就可以得到推荐的RGB的mean。原创 2023-04-19 17:37:10 · 1050 阅读 · 0 评论 -
深度学习中的各种不变性
不变性:指的是即使目标外观发生了某种变化(平移、旋转、尺度缩放、光照变化等),依然可以将它识别出来。不变性对于图像分类来说是一种很好的特性,因为我们希望图像中的目标无论是发生平移、旋转、缩放,还是在不同的光照条件或视角下,都可以被成功地识别出来。原创 2023-04-18 11:12:12 · 1296 阅读 · 1 评论