Xlxlkkxx-CSDN博客

原创 RNN系列

之前的FC、Conv每一层的节点之间没有相互关联，无法体现输入前后关系。

2023-06-01 19:58:03 155

原创 yolov3_spp项目中的各种配置文件读取

后缀名 .ymal .txt .json.cfg .data .names .shapes 可以自定义后缀名？？pyhon文件操作大全。

2023-05-29 15:54:27 152

原创 04 交叉熵损失CrossEntropyLoss

发现对一些概念很模糊，查阅资料再读。

2023-05-24 14:38:31 111

对 Input Feature Map 以不同采样率的空洞卷积并行采样；将得到的结果 concat ，扩大通道数；最后通过 1 × 1 卷积将通道数降低到预期的数值。相当于以多个比例捕捉图像的上下文。BP解决了网络训练的软件问题（权重更新），pooling解决训练的硬件问题（对计算资源的需求），对像素的位置很敏感，pooling是一个不断丢失位置信息的过程。池化层缩小特征层的尺寸，可以快速扩大感受野。这东西不够好，V3舍弃了CRF，不用管。可以在不增加计算量的情况下。验证时：损失计算，打印。

2023-05-22 13:31:51 171

原创 01 FCN（2015）

预测图中通道数==类别数+1，将每个通道的左下角元素做softmax回归；概率最大的通道数就是该像素的预测类别索引，相当于。Constant Warmup：学习率从非常小的数值。刚开始模型对数据完全不了解，此时需要使用小学习率。Linner Warmup：学习率从非常小的数值。Cosine Warmup：学习率先从很小的数值。对数据了解了一段时间之后，可以使用大学习率。指的是下采样32倍，然后还原到原图尺寸。求每个像素的分类问题类别损失，然后求平均。增加到预设学习率，然后按照。时，使用小学习率进行。

2023-05-18 13:08:42 192

原创 00 语义分割

在背景处的像素值为0，目标边缘处用的像素值为255(训练时一般会忽略像素值为255的区域)，目标区域内根据目标的类别索引信息进行填充，例如人对应的目标索引是15，所以目标区域的像素值用15填充。简单来讲就是重复所给定的一组系数，如r=[1,2,3,1,2,3],r=[1,2,5,1,2,5]类似这种格式。k表示转置卷积的kernel_size大小，s表示转置卷积的步距，p为转置卷积的padding。假设都使用K*K的卷积核，连续多次卷积，膨胀系数应满足如下。ri表示第i个卷积的膨胀系数。

2023-05-17 18:45:48 42

原创 03 SSD + retinanet

在6个特征图上预测。

2023-05-15 13:48:49 50

原创 02 FPN

个人笔记。

2023-05-12 16:47:04 53

原创 PASCAL VOC2012 自定义Dataset

个人笔记代码及资料来源。

2023-05-12 10:37:29 367

原创 01 Faster R-CNN系列

个人笔记。

2023-05-11 18:49:29 202

原创 pycocotools 使用 + json

个人笔记原博文MS COCO数据集介绍以及pycocotools简单使用。

2023-05-11 10:31:59 419

原创 11 RepVGG（2021）

原文链接repvgg以下是个人笔记，提取重点。

2023-05-10 18:04:19 59 1

原创 10 ConvNeXt

仅是个人笔记，代码学习资源来源B站博主。

2023-05-10 16:27:24 159 1

原创 09 EfficientNet系列

仅是个人笔记，代码学习资源来源B站博主。

2023-05-10 10:36:09 214

原创 08 Shufflenet

仅是个人笔记，代码学习资源来源B站博主Shufflenet对标mobilenet，轻量化网络。

2023-05-09 18:09:43 39

原创 04 resnext

仅是个人笔记，代码学习资源来源B站博主。

2023-05-09 13:33:59 45

原创 07 Swin-Transformer

目录一、理论知识1. 整体架构2. stage中的Patch Merging3. W-MSA和SW-MSA3.1 W-MSA3.2 SW-MSA 4. Relative Position Bias5. 参数配置二、网络复现1. 网络搭建2. train个人学习笔记资料来源： 12.1 Swin-Transformer网络结构详解_哔哩哔哩_bilibilib图2个区别在于 W-MSA和SW-MSAstage1之前的 Pach Parition +++++ stage1的 Linear Embedding

2023-05-09 12:52:22 287

weixin_63510030的博客

原创 RNN系列

原创 yolov3_spp项目中的各种配置文件读取

原创 04 交叉熵损失CrossEntropyLoss

原创 03 U2net

原创 02 DeepLab系列总结

原创 01 FCN（2015）

原创 00 语义分割

原创 03 SSD + retinanet

原创 02 FPN

原创 PASCAL VOC2012 自定义Dataset

原创 01 Faster R-CNN系列

原创 pycocotools 使用 + json

原创 11 RepVGG（2021）

原创 10 ConvNeXt

原创 09 EfficientNet系列

原创 08 Shufflenet

原创 04 resnext

原创 07 Swin-Transformer

原创 Confusion Matri 混淆矩阵

原创 06 Vision Transformer

原创 Transformer

原创 Self-Attention、Multi-head Self-Attention

原创 05 mobilenet系列（1、2、3）

原创 04 resnet（2014）

原创 03 Googlenet（2014）

原创 02 VGG（2014）

原创 01 AlexNet（2012）

空空如也

空空如也