大路诗人路小果-CSDN博客

原创数据集标签数量不均衡如何设计loss均衡数量

对于哪些数量分布比值较少的标签提供更多的loss注意力比重，如何提高训练注意力比重，也就是说，让模型的梯度更多的倾向于有利于数据标签分布较少的数据训练，对于loss来说就是扩大这个标签的loss。

2024-05-07 09:44:53 197

原创 PromptMRG(上—背景介绍): Diagnosis-Driven Prompts for Medical Report Generation

Automatic medical report generation (MRG) is of great research value as it has the potential to relieve radiologists fromthe heavy burden of report writing. Despite recent advancements, accurate MRG remains challenging due to the needfor precise clinical

2024-04-09 11:08:34 1116

原创阅读 Dictionary Learning (2011)(上). What is the right representation for my signal?

阅读 Dictionary Learning (2011). What is the right representation for my signal?（I Tošić, P Frossard）Huge amounts of high-dimensional information are captured every second by diverse natural sensors such as the eyes or ears, as well as artificial sensors l

2024-04-08 22:01:21 553

原创在集群中使用deepspeed如果端口被占用可以使用deepspeed参数更改

这些命令居然都不好使，还是CSDN上的回答数据稀疏度更好，G老师墨迹来墨迹去都是让我该环境变量，结果通通不好使。最终还是这个命令一招见效。使用就将 29500 改成 29501。在集群中使用deepspeed默认的端口号29500被占用，显示更改居然不起作用。G老师给的方法也不好使。这一次G老师不好使了。

2024-04-04 22:11:17 272

原创使用deepspeed，transformers，safetensor中常见的训练精度，共享权重问题

虽然deepspeed有混合精度训练的功能，但是对于网络上各种奇奇怪怪的代码的DIY转化中，他还是很弱小的。它的精度问题，使用deepspeed如果模型中有部分模型使用的是half精度，那么整个模型都会使用half精度，即使是nn.LayerNorm这样新创立的层。因为我们通常可能在计算权重的时候使用half，在LayerNorm的时候使用float32这样更好的归一化，防止因为的问题消失或者爆炸。所以通常建议使用float32精度进行计算。

2024-04-03 19:36:53 454

原创使用deepspeed小记

医学图像经常很大，所以训练模型有时候会有难度，但是现在找到了很多减少显存的方法。不知道为什么，使用transformers的trainer库确确实实会减少显存的占用，即使没有使用deepspeed，占用的显存也会减少。我推荐使用transformers集成模型和训练集，只需要写一个dataset和collate_fn，最多再多写一个Trainer的computer_loss,模型就可以自然而然的搞定。效率最高最有效。

2024-04-02 15:29:18 545

原创文本评估指标 BLEU，METEOR，ROUGE

ref_tokens = list(jieba.cut("这个是什么东西，狗吗"))cand_tokens = list(jieba.cut("这个不像是狗，更像是猫"))# embed()

2024-04-01 21:38:38 331

原创数据集划分，根据多个标签进行训练集和测试集的划分

在模型的训练和测试中，科学的划分训练集和测试对模型的任务目标和效果测量范式至关重要我们实际中可能看到的样本可能具有多个属性，标签。它既是大的，又是有颜色，对这样的样本进行划分至关重要。

2024-04-01 09:36:16 273

原创打开DICOM文件需要注意到的点

【代码】打开DICOM文件需要注意到的点。

2024-04-01 01:04:12 247

原创精读 Generating Mammography Reports from Multi-view Mammograms with BERT

代码。

2024-03-31 22:24:51 1040

原创浅读 Natural Language Generation Model for Mammography Reports Simulation

这是一篇报告生成去伪的文章，重点看生成报告的真实性Extending the size of labeled corpora of medical reports is a major step towards a successful training of machine learning algorithms. Simulating new text reports is a key solution for reports augmentation, which extends the coh

2024-03-31 15:34:17 832

原创 R2GenCMN中的Encoder_Decoder结构

首先介绍一下整体结构，这里的baseCMN其实就是一个包装了的Transformer的，这个Transformer里面是有n个连续的encoder和n个连续的decoder组成的。图片的输入进入encoder进行编码，这个过程是Transformer的结构，加入了位置编码和注意力机制。（凡是框框里面有的，都是一个类）文章中的组件是在。

2024-03-31 14:22:12 868

原创 safetensor的使用

这里的checkpoint就是和bin加载时一样的字典数据类型，模型如何加载和bin文件一样。

2024-03-31 11:58:22 544

原创 CLIP 中不一定会被注意的细节（ResNet 网络的改进）

【代码】CLIP 中不一定会被注意的细节（ResNet 网络的改进）

2024-03-25 15:11:09 410

原创更好的理解CLIP模型

视觉编码器的输出是这样的，你可以很容易通过这样的理解，迁移使用到resnet等其他网络。如果将image和text其中一个进行。

2024-03-25 14:47:59 250

原创 R2GenCMN精读

如果回顾整个模型，那么可以说，CMN的加入是这个模型的唯一不同。如果想要去除CMN，进行Base模型的测试可以直接更改这里注释的内容，其它内容都是一样的。这里的decode函数内的embedding直接使用就是去掉了CMN。

2024-03-25 01:14:58 992

原创 GLoRIA注意力

提出了一种不依赖于预训练对象检测模型来提取子区域图像特征的方法。这种方法是通过学习注意力机制，根据每个子区域对于给定单词（可能是图像的标签或描述中的词汇）的重要性进行加权。通过这种方式，系统能够对比注意力加权后的图像表示和对应的单词嵌入，进而学习到注意力权重。这样，注意力权重就成为了模型中局部特征表示的一部分，有助于更好地捕捉医学图像中的关键信息。记录一下feature map的生成过程。这样就得到attention map。然后就是和原来的图片进行匹配。

2024-03-22 10:17:01 247 1

原创 GLoRIA精读20240314 （下）

模型今天跑起来了，所以今天出来完成一下博客。

2024-03-21 15:46:12 701 1

原创 iPad ssh连接服务器编程没有好的操作界面，使用jupyter-lab在网页上就能编程啦

开始使用apk的消息和信息,您将看到默认的fish登录欢迎消息:欢迎使用fish,友好的交互式shell。iPad也是有操作系统的设备，实际上它也能当电脑使用，由于科研生活需要，连接集群是常有的事。使用ssh连接集群通常需要两次连接，第一次连接服务器节点（提交任务sbatch），第二次连接执行节点（执行任务）iSH 可以打开iPad的内部terminal，这是不同于ssh的其他软件的。我使用的是iPad的软件 iSH, 我觉得您使用其他任何其他软件都可以。执行之前的ssh命令，现在就可以进行敲代码了。

2024-03-20 14:34:41 375 1

原创 GLoRIA精读20240315 （中）

今天在使用网络的时候，发现生成注意力图很难，这个是因为中文医学词汇的数据集库分词，并不流行。但是GLoRIA给了我们一个新的思路，那就是使用与的方法。这也就是对比学的有点，医学图像特有的特点，使用局部有代表性的特征，就能给整个图片进行定义。这就是医学图像和自然图像的本质差别。论文的GLoRIA里面重点关注了注意力接着（上），进行代码实验。

2024-03-16 19:02:13 353 1

原创 GLoRIA精读20240314 （上）

In recent years, the growing utilization of medical imaging is placing an increasing burden on radiologists. Deep learning provides a promising solution for automatic medical image analysis and clinical decision support. However, large-scale manually(compa

2024-03-15 12:39:45 912 1

a14285700的博客

原创数据集标签数量不均衡如何设计loss均衡数量

原创 PromptMRG(上—背景介绍): Diagnosis-Driven Prompts for Medical Report Generation

原创阅读 Dictionary Learning (2011)(上). What is the right representation for my signal?

原创在集群中使用deepspeed如果端口被占用可以使用deepspeed参数更改

原创使用deepspeed，transformers，safetensor中常见的训练精度，共享权重问题

原创使用deepspeed小记

原创文本评估指标 BLEU，METEOR，ROUGE

原创数据集划分，根据多个标签进行训练集和测试集的划分

原创打开DICOM文件需要注意到的点

原创精读 Generating Mammography Reports from Multi-view Mammograms with BERT

原创浅读 Natural Language Generation Model for Mammography Reports Simulation

原创 R2GenCMN中的Encoder_Decoder结构

原创 safetensor的使用

原创 CLIP 中不一定会被注意的细节（ResNet 网络的改进）

原创更好的理解CLIP模型

原创 R2GenCMN精读

原创 GLoRIA注意力

原创 GLoRIA精读20240314 （下）

原创 iPad ssh连接服务器编程没有好的操作界面，使用jupyter-lab在网页上就能编程啦

原创 GLoRIA精读20240315 （中）

原创 GLoRIA精读20240314 （上）

原创 nltk 离线下载 wordnet 测试meteor评估指标，支持中文本生成数据集使用

原创 ResNet网络卷积视觉网络和 Vit （Vision Transformer）两种网络对比，在特征提取上的不同

原创 ResNet网络卷积视觉网络和 Vit （Vision Transformer）两种网络对比

原创为什么你每次训练模型，结果都不一样，如同玄学

原创手动尝试加载权重，继续进行训练

原创 pytorch遇到精度混合的问题，混合精度前向和反向传播

原创 Vision Transformer (ViT)模型的输出，[‘last_hidden_state‘, ‘pooler_output‘, ‘hidden_states‘]区别

原创【pip install镜像源】

原创 torch,GPU，nii重采样，多线程，内存保护，检索对应的标签信息，根据分割标签信息重采样MRI

原创【检查nii文件所有的像素值是否有小于零的情况,使用GPU判断,多线程】

原创【超线程，重采样，插值法，内存监控】

原创删除两个路径下的同名文件夹

原创重采样nii文件，插值法

空空如也

空空如也