okimaru-CSDN博客

原创 Face XY project

【代码】Face XY project。

2024-04-28 18:38:27 595

处理数据增强需要用到images和labels。我保存的labels是txt文件，但是。目标检测的类别，有几个就填几个，我只有一个类别，就写了“defect”，结束后得到xml形式的数据增强labels和数据增强的images。现在需要将数据增强的xml格式的文件转换为txt文件，使用。修改需要转换的xml文件名为“tooth”将txt转换为xml文件后，使用数据增强。中需要对xml文件进行处理，因此需要。将txt文件进行转换。将xml文件进行转换。

2024-04-12 15:10:15 334 3

原创 [NVIDIA]Accelerating Applications with CUDA C/C++笔记

在高层次上，执行配置允许程序员为内核启动指定**线程层次结构**，它定义了线程分组的数量（称为**块**），以及在每个块中执行的**线程数**。稍后将在实验室中详细探讨执行配置，但目前请注意，内核是使用包含“1”线程（第二个配置参数）的“1”线程块（第一个执行配置参数）启动的。此外，每个块都有一个索引，从 0 开始。CUDA 内核可以访问特殊变量，这些变量既可以识别执行内核的线程（在块内）的索引，也可以标识线程所在的块（在网格内）的索引。** 内核代码由内核启动时配置的每个线程块中的每个线程执行**。

2024-04-07 14:01:55 454 1

原创目标检测系列模型发展历程

VOC-->COCO。

2024-03-27 19:52:25 515

原创 YOLOv5s处理二维牙齿数据集

640x640的图像。

2024-03-25 09:43:12 349

原创目标检测的指标评估

$\text{召回率} = \frac{\text{真正例 (TP)}}{\text{真正例 (TP)} + \text{假负例 (FN)}}$$2. 召回率 (Recall): 表示在所有应该被检测到的目标中，模型正确检测到的目标所占的比例。3. F1 分数 (F1 Score): 精确度和召回率的调和平均值，是衡量模型准确性的一个重要指标，尤其在类别不平衡的情况下。不同的应用场景可能对精确度、召回率、IoU等指标的重视程度不同，因此选择合适的评价指标和阈值是评估目标检测模型性能的关键。

2024-03-23 13:41:48 751

原创 YOLOv3: An Incremental Improvement

因此，Darknet-53的性能与最先进的分类器相当，但浮点运算更少，速度更快。Darknet-53比ResNet-101更好，速度快1:5倍。Darknet-53的性能与ResNet-152相似，速度是ResNet-152的2倍。新网络是YOLOv2、Darknet-19中使用的网络和那些新奇的残余网络之间的混合方法。我们的网络使用连续的3 × 3和1 × 1卷积层，但现在也有一些快捷连接，并且明显更大。这个新网络比Darknet19强大得多，但仍然比ResNet-101或ResNet-152更有效。

2024-03-10 14:50:55 372

原创 YoLo进化史《A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 TOYOLOV8 AND BEYOND》

40]。受GoogLeNet[41]和Network in Network[42]的启发，YOLO使用1 × 1卷积层来减少特征映射的数量，并保持相对较低的参数数量。作为激活层，表1描述了YOLOv1体系结构。作者还介绍了一个更轻的模型，称为Fast YOLO，由9个卷积层组成。

2024-03-10 13:12:50 1332

原创【Transformer】Attention Is All You Need

主要的序列转导模型是基于复杂的循环或卷积神经网络，包括一个编码器和一个解码器。表现最好的模型还通过注意机制连接编码器和解码器。我们提出了一个新的简单的网络架构，变压器，完全基于注意力机制，完全摒弃递归和卷积。在两个机器翻译任务上的实验表明，这些模型在质量上更优越，同时更具并行性，并且需要更少的训练时间。我们的模型在WMT 2014英语-德语翻译任务上实现了28.4 BLEU，比现有的最佳结果(包括集合)提高了2个BLEU以上。

2024-01-30 17:49:11 909

原创 Multi-view Local Co-occurrence and Global Consistency Learning Improve Mammogram Classification ...

在分析筛查乳房x线照片时，放射科医生可以自然地处理每个乳房的两个同侧视图的信息，即颅-尾侧(CC)视图和中外侧-斜位(MLO)视图。这些多个相关图像提供了互补的诊断信息，可以提高放射科医生的分类准确性。不幸的是，大多数现有的深度学习系统都是用全局标记的图像进行训练的，缺乏从这些多个视图中联合分析和整合全局和局部信息的能力。通过忽略在一个放映集的多个图像中存在的潜在有价值的信息，人们限制了这些系统的潜在准确性。

2024-01-26 22:30:57 835

原创【多模态（影像）自监督学习】UniMiSS: Universal Medical Self-Supervised Learning via Breaking Dimensionality Barrie

自监督学习(SSL)为医学图像分析提供了巨大的机会，众所周知，医学图像分析缺乏注释。然而，由于高成像成本和隐私限制，聚合大量(未标记的)3D医学图像(如计算机断层扫描(CT))仍然具有挑战性。在本文中，我们提倡引入丰富的2D图像，如胸部x光片，以弥补缺乏3D数据，旨在建立一个，称为UniMiSS。接下来的问题是如何打破维度障碍，即使2D和3D图像都可以执行SSL?为了实现这一点，我们设计了一个金字塔形的u形医疗变压器(MiT)。它由可切换贴片嵌入(SPE)模块和变压器组成。

2024-01-26 16:57:05 948

原创【多模态（影像）自监督学习】Uni4Eye: Unified 2D and 3D Self-supervisedPre-training via Masked Image ModelingTran

大规模标记数据集是计算机视觉中监督深度学习成功的关键因素。然而，标注的数据数量有限是非常常见的，特别是在眼科图像分析中，因为手动标注是费时费力的。自监督学习(SSL)方法为更好地利用未标记数据带来了巨大的机会，因为它们不需要大量的注释。为了尽可能多地使用未标记的眼科图像，有必要打破尺寸障碍，同时使用2D和3D图像。在本文中，我们提出了一个通用的自监督Transformer框架，名为Uni4Eye，用于发现眼科图像的固有属性并捕获嵌入的特定领域特征。

2024-01-26 16:21:20 953

原创 TumorCP: A Simple but Effective Object-LevelData Augmentation for Tumor Segmentation

众所周知，深度学习模型需要大量数据。因此，在医学图像分析中，迫切需要数据高效的技术，因为收集有良好注释的数据既昂贵又耗时。受最近复兴的“复制-粘贴”增强方法的启发，我们提出了一种简单而有效的针对肿瘤分割的对象级数据增强方法TumorCP。TumorCP是在线和随机的，为肿瘤的主体、位置、外观和形态提供了无限的增强可能性。在肾肿瘤分割任务上的实验表明，在肿瘤Dice上，TumorCP比强基线高出7.12%。此外，加上图像级数据增强，它在肿瘤骰子上比目前最先进的技术高出2.32%。

2024-01-22 20:09:01 736

原创 U-Mamba: Enhancing Long-range Dependency for Biomedical Image Segmentation

卷积神经网络(Convolutional Neural Networks, cnn)和transformer是生物医学图像分割中最流行的架构，但由于固有的局部性或计算复杂性，它们处理远程依赖关系的能力有限。为了解决这一挑战，我们引入了U-Mamba，一个通用的生物医学图像分割网络。受状态空间序列模型(ssm)的启发，我们设计了一个混合CNN-SSM块，它将卷积层的局部特征提取能力与ssm捕获远程依赖的能力相结合。状态空间序列模型是一种以处理长序列的强大能力而闻名的新型深度序列模型。

2024-01-22 18:59:12 2160

原创以＜SegVol＞为模板研究一篇论文的写作模式及方法内容

体积图像分割的意义（做这个事情的意义）。目前针对这个事情/方向的局限性，所以提出了自己的创新点，简单描述这个模型，并给出分割结果。如果有比目前主流模型高的多的得分，可以在这个写上。最后给出github地址。

2024-01-20 18:56:49 874

原创 SegVol: Universal and Interactive Volumetric Medical Image Segmentation

精确的图像分割为临床研究提供了有意义且结构良好的信息。尽管在医学图像分割方面取得了显著的进展，但仍然缺乏一种能够分割广泛解剖类别且易于用户交互的基础分割模型。本文提出了一种通用的交互式体医学图像分割模型——SegVol。通过对90k个未标记的CT卷和6k个标记的CT卷进行训练，该基础模型支持使用语义和空间提示对200多个解剖类别进行分割。大量的实验证明，SegVol在多个细分基准测试中表现出色。在三个具有挑战性的病变数据集上，该方法比nnU-Net的Dice得分高20%左右。

2024-01-16 20:34:15 893

原创 Loss function的比较

1、MSE（先码）

2024-01-12 10:25:47 366

原创基于多媒体的深度学习 Midreport自我总结分析

1、调整模型架构：增加模型的复杂性，例如增加卷积层或全连接层的数量，增加神经元数量等。4、增加训练时长：增加eopchs的值。需要将误差降低到1%以下。

2024-01-12 10:24:32 420

原创 ResNet网络架构

先码，明天更。

2024-01-11 22:16:19 369

原创 PyTorch自学&遇到的一些错误

数据需要时transforms类型，所以得到Compose([transforms参数1,transforms参数2,…help():说明书---->help(torch.cuda.is_available)dir():打开操作，能看到里面有什么东西---->dir(torch)图像变换，transform的使用。Scalar_value：y轴。图片--->工具 --->结果。Tensorboard的使用。Global_step：x轴。常见的Transforms。DataLoader的使用。

2024-01-11 14:43:56 1539 1

原创语义分割中的采样

FULL卷积：放大图像的作用，放大后的结果中，通过补零的操作，原图像边缘效果会很差。A：每层特征提取都能得到一个轮廓，高纬度的特征，提高卷积核的覆盖。下采样丢弃全连接层，通过卷积的方式得到特征点热图。上采样预测图像为灰度图像，不同灰度代表不同的语义。一、下采样：由输入图片得到特征点热图。二、上采样：由特征点热图得到预测图。新方法：像素点周围补零实现反卷积。经典：FCN、U-Net。常用：双线性插值、反卷积。SAME卷积：（待填写）为什么要进行下采样？

2024-01-11 14:42:28 382

原创 ReLU激活函数

3、ReLU会使一部分神经元的输出为0，造成网络的稀疏性，并减少了参数的相互依存关系，缓解了过拟合问题的发生。线性激活函数的输入输出都是线性组合，与没有隐藏层效果相当。如何把“激活的神经元的特征”通过函数把特征保留并映射出来，即负责将神经元的输入映射到输出端。1、没有饱和区，不存在梯度消失问题，防止梯度弥散。2、部分神经元会被激活，网络稀疏，计算有效率。3、没有复杂的指数运算，计算简单，效率提高。二、为什么使用非线性的激活函数？3、ReLU函数的导数计算更快。1、不会产生梯度弥散现象。一、什么是激活函数？

2024-01-11 14:41:33 373

原创 LeNet-5（用于手写体字符识别）

Output层也是全连接层，共有10个节点，分别代表数字0到9，且如果节点i的值为0，则网络识别的结果是数字i。可训练参数：（5*5+1) * 6（每个滤波器5*5=25个unit参数和一个bias参数，一共6个滤波器）输出featuremap大小：28*28 （32-5+1）=28。可训练参数/连接：120*（16*5*5+1）=48120。连接数：（5*5+1）*6*28*28=122304。输出featureMap大小：1*1（5-5+1）连接数：16*（2*2+1）*5*5=2000。

2024-01-11 13:25:10 965

原创【kaggle】数据可视化

先码。

2024-01-03 20:41:35 380

原创 Timm（Pytorch Image Models）

Timm库不仅提供了模型的权重，还提供了分布式训练和评估的代码框架，方便后人开发。它还在不断地更新迭代新的训练方法，新的视觉模型和优化代码。旨在将各种 SOTA 模型整合在一起，并具有复现 ImageNet 训练结果的能力，可进行迁移学习。

2024-01-03 20:20:04 349

原创 ResNet

并不是层数越多，训练效果就越好。层数越多，计算量过大，超出承受程度。ResNet模块中增加了快捷连接分支，平衡线性转换和非线性转换。

2024-01-03 20:10:34 339

原创【nnUNet系列】MedNeXt

MedNeXt是ConvNeXT的改进版，是大卷积核分割网络，作者设计了一种带残差的。上采样和下采样块，以保持跨尺度的语义丰富性，对小卷积核网络进行上采样来迭代增加。该网络各有 4 个对称编码器和解码器层，中间嵌入一个瓶颈层。大小，以防止有限医疗数据的性能饱和。

2024-01-03 19:31:19 531

原创 nnU-Net

2、动态修改的网络结构：根据输入图像的大小和其他属性，nnU-Net的网络结构可以动态调整，例如卷积层的数量和滤波器的数量。1、自适应预处理和后处理：nnU-Net引入了自动确定输入数据的正规化策略、自动确定输出数据的阈值等策略。3、多模态和3D数据处理：nnU-Net能够处理不同模态的医学图像数据，并对3D数据进行有效分割。4、集成学习：nnU-Net使用了多个模型的集成来进一步提高性能。

2024-01-03 18:14:09 360

原创 OmniSeg3D: Omniversal 3D Segmentation via Hierarchical Contrastive Learning

对于每个输入的RGB图像（a），应用2D分层建模来获得块索引图和相关矩阵（b）。在具体的训练过程中，使用基于NeRF （或网格）从3D空间渲染特征（c），并将分层对比学习（d）应用于渲染的特征，以优化用于分割的特征场。它要处理的任务是新视角合成。我们用一个直观的表述方式来理解它的作用，如下图所示，如果我们需要对图中的挖掘机进行新视角合成，首先我们会围绕挖掘机采集不同角度的图像，之后计算每个采集角度的相机位姿，将采集的图像序列以及它们对应的位姿送入到NeRF，就可以合成一些新的视角。

2023-12-28 22:01:34 409

原创 UNet全家桶系列

2018年2019年。

2023-12-21 19:03:33 368

原创 UNet++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation

4）在UNet++中引入了一个内置的深度可变的U-Net集合，可为不同大小的对象提供改进的分割性能，这是对固定深度U-Net的改进。在网络架构方面，该文章提出了一种新的神经网络架构，名为UNet++，并通过重新设计跳跃连接和引入新的剪枝方案来提高分割效果和推理速度。该文章的输出是对医学图像进行分割后得到的掩模图像，用于标识图像中不同的组织或器官。该文章使用的输入是医学图像，包括电子显微镜图像、细胞CT图像、核图像、脑部MRI图像、肝脏CT图像和肺部结节CT图像。

2023-12-21 18:32:18 442 1

原创 U-Net: Convolutional Networks for Biomedical Image Segmentation

该文章的创新点是提出了一种名为U-Net的网络架构和训练策略，该架构利用数据增强来更有效地使用可用的注释样本。U-Net网络由一个收缩路径和一个对称扩张路径组成，可以从非常少的图像端到端训练，并在电子显微镜堆中神经结构分割的ISBI挑战中优于以前的最佳方法。该文章的贡献是提出了一种新的网络架构和训练策略，可以更有效地使用有限的注释样本进行生物医学图像分割，并在多个挑战中取得了最佳结果。该文章的动机是提出一种网络和训练策略，以有效地利用生物医学图像分割的注释样本。该网络架构快速且优于以前的方法。

2023-12-21 18:31:30 373

原创 codeforces 1092C Prefixes and Suffixes【字符串+思维】

题目链接：点这里题意：这题意我读错了三个小时...最后到网上找题解的时候才发现读错了QAQ暴击题意是判断给你的2*n-2个字符串是前缀还是后缀，不是判断这个字符串的内容...我真的欲哭无泪，理解能力太菜了思路：将两个n-1长的字符串取出，先判断第一个取出的字符串和给出的字符串前缀的匹配程度。如果匹配程度大于半数，则这个为所需字符串-1，否则就是另外一个。同时要注意回文串的情况，所以开了...

2019-05-25 16:51:11 195 1

原创 HDU-1754 D - I Hate It 【线段树模板题】

链接：点这里题意：给你多组数据，每一组n,m,有n个学生，m次查询，其中Q a b表示查询在a到b区间里的最高分，U a b表示更新a学生的成绩为b。思路：裸的线段树，记住开数组要*4，hdu是多组输入。我wa了好多次的原因竟然是...query的板子写错了。找区间最大值应该左边和右边分别遍历，我写成了if...else关系#include<iostream>#incl...

2019-05-20 15:47:36 144

原创 codeforces 1166B All the Vowels Please

链接：点这里题意：给你一个数字，判断它能不能变成一个n*m=k的矩形，并且每行每列都有完整的五个元音字母。思路：一判断不是素数，二判断长和宽要大一等于5就好了。判断素数的时候还写错了。wa了一发。窒息#include<stdio.h>#include<string.h>#include<iostream>#include<string&...

2019-05-19 22:34:00 190

原创 codeforces 1166A Silent Classroom

题目链接：点这里题意：一个人数n，有n个人名，要把他们分到两个教室里，名字首字母的尽量不要放一起，如果有名字首字母一样的放一起，就要加一张凳子。思路：刚开始我找起了规律，然后wa了好多。。明明是一道水题。正解是开两个数组，只要每次读入把名字放到相同首字母比较少的那个数组里就好了。太菜了，浪费了我好久时间，打div2，最后太困了，只写了两道题，就去睡觉了，光荣掉分。#include&l...

2019-05-19 22:31:04 225

原创 CSU-1803 2016 【同余】

题目链接：点这里思路：开两个数组a[2016],b[2016],存入n被2016整除的个数。接下来计算n和m模2016的个数。for example,当n=4031，则n % 2016=2015，那么a[i]从1到2015都可以被拿来计算，并算出它的个数（同余）。同理可得b[i]。接下来只需要计算(i*j) % 2016是否为0即可得出。#include<iostream>...

2019-05-12 16:19:50 148

原创 codeforces 1154E Two Teams

题目链接：Two Teams题意：有两个教练，team=1和team=2，两个教练分别要挑人进入自己的集训队。每次挑分数最高的以及他两边最多k个人进队伍。问挑完以后哪些人进了1队哪些人进了2队思路：在网上看到了大佬们用c++的STL里的list进行操作，即可#include<iostream>#include<algorithm>#include<s...

2019-05-12 14:09:40 311

原创【读书笔记】web程序设计第二章 HTML/XHTML简介

1、基本语法<p> This is simple stuff.</p>//p为标签名，</p>是对应的结束标签//注释2、HTML文档的标准结构必须包含四组标签<html><head><title>&lt

2019-03-07 11:58:32 159

原创 Kattis-dst Daylight Saving Time【题解】

#include<iostream>#include<algorithm>#include<stdio.h>#include<stdlib.h>#include<memory.h>using namespace std;int main(){ int t; while (cin >> t) { whi...

2019-03-07 11:03:00 380

空空如也

空空如也