科研澡-CSDN博客

原创论文阅读笔记-TransFG: A Transformer Architecture for Fine-Grained Recognition

目录摘要1.引言2.相关工作3.方法3.1 Vit作为特征提取器3.1.1 图像序列化3.1.2 patch嵌入3.2 TransFG 结构3.2.1 区域选择模块摘要细粒度视觉分类(FGVC)旨在从子类别中识别对象，这是一项非常具有挑战性的任务，因为其固有的微妙的类间差异。现有的工作主要通过重用主干网络提取检测到的识别区域的特征来解决这一问题。然而，这种策略不可避免地会使管道复杂化，并推动建议的区域包含对象的大部分部分，因此无法定位真正重要的部分。.

2022-03-24 15:52:42 2241

转载论文阅读笔记-Improving Convolutional Networks with Self-calibrated Convolutions

目录摘要引言摘要在本文中，我们考虑在不调整模型架构的情况下改进CNN的基本卷积特征转换过程。为此，我们提出了一种新颖的自校准卷积，该卷积通过内部通信显着扩展了每个卷积层的视场，从而丰富了输出功能。特别是，与使用小卷积核（例如3 x 3）融合空间和通道方向信息的标准卷积不同，我们的自校准卷积通过新颖的自我自适应地围绕每个空间位置建立了长距离空间和通道间依赖性的校准操作。因此，它可以通过显式合并更丰富的信息来帮助CNN生成更多辨识性表示。我们的自校准卷积设计简单且通用，可以轻松应用于增

2022-01-17 18:08:40 455

原创论文阅读笔记-GT U-Net: A U-Net Like Group TransformerNetwork for Tooth Root Segmentation

目录摘要1.引言摘要为了实现对根管治疗的准确评估，一个基本的步骤是对口腔x线图像进行牙根分割，因为牙根边界的位置是根管治疗评估中重要的解剖信息。然而，模糊边界使得牙根的分割非常具有挑战性。在本文中，我们提出了一种新的端到端U-Net like Group Transformer Network(GTU-Net)用于牙根的分割。该网络保留了U-Net的基本结构，但每个编码器和解码器都被一个组Transformer所取代，利用分组结构和bottleneck结构，大大降低了传统transform.

2021-12-27 14:07:03 3056

原创论文阅读笔记-AGMB-Transformer: Anatomy-Guided Multi-Branch Transformer Networkfor Automated Evaluation

目录摘要摘要-对X线图像治疗结果的准确评估是根管治疗中一个重要且具有挑战性的步骤，因为对治疗结果的错误解释会阻碍及时的随访，这对患的治疗结果至关重要。目前，评价都是手工进行的，既耗时、主观，又容易出错。本文旨在利用计算机视觉和人工智能领域的研究进展，实现这一过程的自动化，为根管治疗结果的评估提供一种客观、准确的方法。提出了一种新的解剖引导多分支变压器(AGMB-变压器)网络，首先提取一套解剖特征，然后利用它们引导多分支变压器网络进行评价。具体地说，我们设计了一种多项式曲线拟合分割策略来提取解

2021-11-29 18:57:08 3082

原创论文笔记-Bag of Tricks for Image Classification with Convolutional Neural Networks

目录摘要1.大纲2.Baseline2.1训练预处理2.2测试预处理3.改进点3.1 训练速度3.1.1 batch size调整3.2 网络结构3.2.1 模型调整3.3 训练过程优化3.3.1 Cosine Learning Rate Decay3.3.2 Label Smoothing3.2.3 知识蒸馏（Knowledge Distillation）3.2.4 混合训练（Mixup Train）3.2.5 实验结果摘要很多..

2021-08-23 14:46:21 379

原创网络解读/论文笔记-ReXNet: Diminishing Representational Bottleneck on Convolutional Neural Network

目录1.MobileNetV1特征优点：Depthwise Convolution网络结构2.MobileNet v2改进原因特征：优点：Inverted residual block网络结构图关于shortcut3.ReXNet1.MobileNetV1特征专注于移动端或者嵌入式设备中的轻量级CNN网络。相比传统卷积神经网络，在准确率小幅降低的前提下大大减少模型参数与运算量。(相比VGG16准确率减少了0.9%，但模型参数只有VGG的1/32)。.

2021-08-16 17:54:17 2172 1

原创论文笔记-BIRA-NET: BILINEAR ATTENTION NET FOR DIABETIC RETINOPATHY GRADING

·目录摘要1.引言2.相关工作3.提出BIRA-NET分级方法3.1常规ResNet3.2提出注意力机制3.3.所提出的双线性模型3.4 分级损失4.实验结果4.1数据集及实现：4.2性能标准4.3 Baseline方法4.4结果5.结论目录摘要糖尿病性视网膜病变(DR)是一种常见的导致失明的视网膜疾病。为了诊断的目的，DR图像分级旨在提供自动的DR分级分类，这在传统的二元DR图像分类研究方法中是没有解决的。眼睛图像中的小物体，...

2021-07-14 16:42:21 737

原创论文笔记-Applications of Deep Learning in Fundus Images: A Review（1）

文章目录目录摘要 1.引言 2.损伤检测 2.1 出血HEs（对应label：渗透） 2.2微血管瘤 2.3渗出物（对应label：无灌注区） 2.4.多种病变 3.疾病诊断/分级 3.1糖尿病性视网膜病变 3.1.1 结合病变检测的方法 3.1.2其他方法 3.2糖尿病性黄斑水肿摘要利用眼底图像进行眼病的早期筛查具有重要的临床意义。由于其强大的性能，深度学习在病变分割、生物标记分割、疾病诊断和图像合成等相关应用中越来越流行。因...

2021-07-10 21:56:33 2607

原创 Linux服务器使用tensorboard可视化训练结果问题记录

使用resnet18跑了一下medmnist的数据集，想使用tensorboard进行可视化途中非常的不顺利，遇到了非常多的问题，包括如下诸多问题以及解决方法问题一TensorFlow installation not found - running with reduced feature set.Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all解决.

2021-03-19 21:19:26 1695 1

XZH16047129的博客