肆——-CSDN博客

原创用于医学图像方面的大模型发展历程

参数量突破1B（10亿级），依赖大规模私有医学数据（如NIH ChestX-ray、UK Biobank）。微软提出分层（Hierarchical）Transformer，适用于高分辨率医学图像（如病理切片）。ConVIRT (2022)：医学图像-文本对比学习模型（如X-ray与报告对齐）。结合ViT与U-Net，首次在医学图像分割任务（如器官分割）上超越纯CNN方法。完全基于Transformer的3D医学图像分割模型（如CT/MRI体积数据）。支持医学图像问答（如皮肤病变分类、X-ray报告生成）。

2025-03-25 11:42:00 817

原创 python机器学习——新手入门学习笔记

TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的概率高，并且在其他文章中很少出现，则认为此词或者短语具有很好的类别区分能力，适合用来分类。获取大规模数据集，需要从网络上下载，函数的第一个参数是 data_home，表示数据集下载的目录,默认是~/scikit_learn_data/特征的单位或者大小相差较大，或者某特征的方差相比其他的特征要大出几个数量级，容易影响(支配)目标结果，使得一些算法无法学习到其它的特征。某一特定词语的idf，可以由。当0<|r|<1时，表示两变量存在一定程度的相关。

2025-03-24 23:05:18 946

原创各种医学方面大模型总结一自用

SAM（Segment Anything Model）是由Meta推出的一种人工智能大模型，专注于图像分割任务。它通过创新的设计和训练方法，能够在零样本（zero-shot）条件下快速适应新的图像分布和任务，展现出与完全监督模型相媲美甚至更优的性能。

2025-03-19 17:03:12 684

原创 MAC安装logisim教程（新手级详细教程）

可以通过设置栏的“文件‘打开之前的保存的文件。选择自己喜欢的版本，我用的是3.8.0。页面如上图，不过刚打开应该是英文版的。点击上方windows的偏好这一栏。上面这两个选择一个下载。点击打开就可以使用了。选择cn就是中文版了。

2025-03-15 17:59:42 1136 1

原创深度学习笔记

弱监督语义分割通过利用更简单的标注信息（如图像级标注、物体点标注、物体框标注等）来训练模型，从而实现对图像中物体的像素级预测。语义亲和力在计算机视觉中，特别是在语义分割任务中，通过定义标签亲和力矩阵，并将其与语义标签联系起来，可以辅助训练语义分割网络，提高分割的精度‌。目标检测(Object Dectection)的任务是找出图像中所有感兴趣的目标(物体)，确定他们的类别和位置。在自然语言处理中，语义亲和力可以帮助理解文本中的词汇和句子之间的关系，从而提升文本分析的准确性。3.目标可能有各种不同的形状。

2025-03-14 21:09:04 281

原创深度学习笔记——验证集和测试集的区别

验证集和测试集在机器学习中扮演着不同的角色：‌验证集用于模型调参和选择，而测试集用于最终评估模型的泛化能力‌。‌测试集‌：用于评估模型在未见过的数据上的泛化能力，即模型在实际应用中的表现。‌测试集‌：在模型训练和验证完成后使用，用于最终评估模型的性能。‌验证集‌：通常从训练集中划分出一部分数据，不参与模型的训练，但在训练过程中用于评估模型的性能。‌测试集‌：用于最终评估模型的泛化能力，其结果应尽可能无偏，反映模型在真实世界应用场景下的表现。最后，使用测试集评估模型在未见过的数据上的性能。

2025-03-12 16:52:25 1478

原创深度学习笔记——残差网络和模型选择

提供为什么一个模型好的理论依据，它可以衡量训练误差和泛化误差之间的间隔。2.感知机是一个二分类模型，是最早的AI模型之一·它的求解算法等价于使用批量大小为1的梯度下降它不能拟合XOR函数，导致的第一次 AI寒冬.对于一个分类模型，VC等于一个最大的数据集的大小，不管如何给定标号，都存在一个模型来对它进行完美分类。模型容量：拟合各种函数的能力，低容量的模型难以拟合训练数据，高容量的模型可以记住所有的训练数据。属于深度学习模型的一种，其核心在于让网络的每一层不直接学习预期输出，而是学习与输入之间的残差关系。

2025-03-11 22:48:29 558

原创深度学习笔记——Resnet和迁移学习

梯度爆炸是指在训练深度神经网络时，通过多层传递的梯度变得非常大，导致权重更新过大，从而使得网络权重的值变得非常大或非常小，这会导致模型的输出变得不稳定。注意力机制(Attention Mechanism)是一种在深度学习模型中模拟人类注意力的机制，它允许模型在处理信息时能够聚焦于当前任务最相关的部分。2.在传统的 CNN 中，每个卷积层试图学习输入与输出之间的映射，即f(x)残差块试图学习输入与输出之间的残差映射，即:H(x)=f(x)-x。最后H(x)与输入x相加，得到输出f(x)=H(x)+x。

2025-03-09 16:23:39 373

原创深度学习笔记——CNN卷积神经网络

它的核心思想是利用卷积层来提取输入数据的特征，并且能够自动学习到这些特征。表示卷积操作时不进行任何边缘填充，导致输出尺寸缩小。空间不变性:由于权重共享，卷积层能够检测到输入数据中的位置不变特征，即无论特征在输入数据的哪个位置出现，卷积层都能检测到。池化层:通常位于卷积层之后，用于降低数据的空间维度，减少参数数量和计算量，同时增强特征的不变性。全连接层:在网络的末端，将卷积层和池化层提取的特征映射到最终的输出，例如分类标签。共享:同一个卷积核的权重在整个输入数据上是共享的，这大大减少了模型的参数数量。

2025-03-08 17:47:58 329

原创深度学习笔记——神经网络

模拟生物神经元，人工神经元有1个或者多个输入（模拟多个树突或者多个神经元向该神经元传递神经冲动）；线性层(Linear Layer)又称全连接层(Full-connected Layer)，其每个神经元与上一层所有神经元相连，实现对前一层的线性组合/线性变换。每个神经元都和前一层中的所有神经元相连，每个神经元的计算方式是对上一层的加权求和的过程。ReLU，全称为：Rectified Linear Unit，是一种人工神经网络中常用的激活函数，通常意义下，其指代数学中的斜坡函数，即f(x)=max(0,x)

2025-03-07 23:32:48 1070

原创深度学习笔记——基础部分

通过使用图像处理、机器学习、模式识别和深度学习等技术，计算机视觉系统能够识别和处理图像和视频中的对象、场景和事件，执行任务如图像分类、目标检测等，并在自动驾驶、监控、机器人导航等多个领域有着广泛的应用。而在深度学习中，特征提取是自动进行的，通过多层神经网络结构直接从原始数据(也可能需要初步处理)中学习复杂特征，减少了对人工干预的依赖，使得模型能够处理更加复杂的数据和任务。如果两个tensor的维度不同，则在维度较小的tensor的前面增加维度，使它们维度相等。tensor维度不等且其中一个维度为1。

2025-03-07 20:40:39 400

原创深度学习代码解读——自用

parser.add_argument('--resume', default='init_weights/deeplab-resnet.pth.tar') # 预训练权重。{'params': model.get_10x_lr_params(), 'lr': args.lr * 10} # 分类头高学习率。通过多级伪掩码的融合，可以提升最终分割结果的精度和鲁棒性。{'params': model.get_1x_lr_params(), 'lr': args.lr}, # 骨干网络低学习率。

2025-03-04 22:58:11 1510

原创深度学习代码分析——自用

{'params': param_groups[2], 'lr': 10*args.lr, 'weight_decay': args.wt_dec}, # 分类头（高学习率）{'params': param_groups[0], 'lr': args.lr, 'weight_decay': args.wt_dec}, # 主干网络（低学习率）avg_meter = pyutils.AverageMeter('loss', 'avg_ep_EM', 'avg_ep_acc') # 统计训练指标。

2025-03-03 20:20:04 1102

原创代码的解读——自用

利用分类模型生成 3 种级别的伪分割掩码（如 CAM、边界增强掩码等）。：使用伪掩码训练 DeepLab v3+ 分割模型，完成像素级分割任务。：DeepLab v3+ 的预训练权重路径（ImageNet 预训练）。：训练一个基于 ResNet38 的多标签分类模型，生成图像级标签。：使用伪掩码训练 DeepLab v3+ 分割模型，实现像素级预测。：利用 Stage1 的模型生成 3 种级别的伪分割掩码。：加载 Stage1 的模型权重（用于初始化部分参数）。：Stage1 训练好的分类模型权重路径。

2025-03-02 23:07:26 931

原创一些阅读医学图像切割的论文时常用到的专有词汇

是一种重要的机器学习方法，其核心在于通过已知的输入特征来预测对应的标签。训练数据没有外部给定的标签，但是模型可以通过一些辅助任务（pretext）来自动生成一些内部的标签，然后用这些内部标签来训练模型，从而学习到数据的内在表示（representation），再用这些表示来做下游任务（downstream），例如在图像上做旋转预测或遮挡恢复等辅助任务，然后用得到的特征向量来做分类或检测等下游任务。训练数据都有完整和准确的标签，模型通过学习输入数据和标签之间的映射关系来完成特定的任务，例如分类、回归等。

2025-03-02 22:56:27 879

原创深度学习笔记——线性回归的从0开始实现

三种图像分割任务（语义、实例和全景分割）为图像中的各个像素分配标签，以标记图像中不同对象和区域的特定边界和形状，并使用颜色、对比度、图像中的位置和其他属性等信息对它们进行分类。而GPU并行计算的能力需要CUDA借助其自带的编程接口和工具，比如C/C++语言来编写并行计算程序，并通过CUDA编译器将程序转化为可以在英NVIDIA GPU上执行的机器码快速运行。（英语：Hyperparameter）是事先给定的，用来控制学习过程的参数。在深度学习中，超参数有：学习速率，迭代次数，层数，每层神经元的个数等等。

2025-03-02 22:56:03 1163

原创深度学习笔记——线性回归，基础优化方法

可以看作是单层神经网络，神经网络源于神经科学，与真实的神经元类似。参数学习：训练损失，最小化损失来学习参数。选择学习率：学习率不能太大，也不能太小。选择批量大小：不能太大，也不能太小。收集训练：数据越多越好。显示解：将偏差加入权重。

2025-02-27 00:16:34 179

原创深度学习笔记数学方面——矩阵计算，自动求导

9.梯度是一个向量，是一个n元函数f关于n个变量的偏导数，梯度会指向各点处的函数值降低的方向。更严格的讲，梯度指示的方向是各点处的函数值减少最多的方向。深度学习中，神经网络的主要任务是在学习时找到最优的参数（权重和偏置），这个最优参数也就是损失函数最小时的参数。但是，一般情况下，损失函数比较复杂，参数也很多，无法确定在哪里取得最小值。该框架具备高度可扩展性，可以进行快速的模型训练，并支持灵活的编程模型和多种语言。4.自动求导，计算一个函数在指定值上的导数，有别于符号求导，数值求导（高数中的）

2025-02-26 22:55:38 360

原创深度学习笔记线性代数方面，记录一些每日学习到的知识

我们知道距离的定义是一个宽泛的概念，只要满足非负、自反、三角不等式就可以称之为距离。torch.arange（）为左闭右开，即[start, end）,torch.range（）为左闭右闭，即[start, end],用于根据步长创建一维tensor。jupyter：Jupyter Notebook 的本质是一个 Web 应用程序，便于创建和共享程序文档，支持实时代码，数学方程，可视化和。torch：Torch是一个有大量机器学习算法支持的科学计算框架，是一个与Numpy类似的张量(Tensor)操作库。

2025-02-25 23:47:49 406

原创深度学习笔记——数据操作

NumPy(Numerical Python) ：是 Python 语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。标量是 0维空间中的一个点，向量是一维空间中的一条线，矩阵是二维空间的一个面，三维张量是三维空间中的一个体。也就是说，向量是由标量组成的，矩阵是向量组成的，张量是矩阵组成的。广播机制：广播(Broadcast)是numpy 对不同形状(shape)的数组进行数值计算的方式，对数组的算术运算通常在相应的元素上进行。

2025-02-24 22:11:36 337

原创栈和队列经典例题

【代码】栈和队列经典例题。

2025-01-19 20:26:53 223

转载深度学习之学习笔记———CNN、RNN、DNN

每一层的卷积层都会对输入的数据进行局部感受野的扫描，通过滤波器提取特征，然后通过激活函数（比如ReLU）引入非线性，使得网络能够学习复杂的特征表示。RNN的核心在于它的循环连接，这使得它能够记住之前的信息，并用这些信息来预测下一个输出。CNN的结构特别适合处理具有网格结构的数据，比如图像。DNN的应用非常广泛，它是一种通用的解决方案，适用于各种复杂的模式识别任务，比如语音识别、自然语言处理、推荐系统等。RNN的最大特点是它的循环结构，这使得它能够处理序列数据，并且能够在序列的不同时间点之间传递信息。

2025-01-19 20:13:09 408

原创头歌python实验：网络安全应用实践3-验证码识别

来说识别率较低，一些图片里有很对五颜六色扰乱识别的点，非常影响识别率。可运用数字图像处理的方法，对图片进行灰度处理，然后再进行去除噪点处理。的全屏截图，请同学们在自己电脑上定位此页面验证码的坐标，在实验环境用坐标从截图中切割出验证码，对此页面的验证码进行识别并输出。平台会对你编写的代码进行测试，分别对两张全屏页面截图进行识别，两张全屏截图的验证码不一样，坐标一样，当两个测试集通过即可通关。读取图像文件，如果图像是不相容的，会先转换成兼容的格式，然后再提取图片中的文本信息。，输出图像的文字识别结果即可。

2025-01-06 22:34:51 1069

原创头歌python实验：网络安全应用实践2-计算机取证

请你在这个函数中读取指定新闻稿的元数据，并将其按照<属性名> : <属性值>的格式打印出来。函数，尝试各种数字、字母组合，成功解压时返回相应的压缩密码。函数中，尝试破解这个文件的密码，并将其密码返回。的名字，然后以此为证据将其逮捕，也就是所谓的电子取证。函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。，如果解压成功，则会输出解压成功，否则会输出解压失败。注意，这个模块的名字对大小写是敏感的，所以，确保。

2025-01-06 22:29:50 1127

原创头歌python实验：网络安全应用实践-恶意流量检测

文件是常用的数据报存储格式，可以理解为就是一种文件格式，只不过里面的数据是按照特定格式存储的，所以我们想要解析里面的数据，也必须按照一定的格式。，需要检测其中的恶意流量。请对其进行检测并按返回测试说明的格式返回。函数，期间产生的输出将会与规定的输出进行比较，详细要求请见测试说明。为了完成本关任务，你需要掌握：1.re库的使用，2.pcap包的读取。平台会对你编写的代码进行测试：代码请写在。为了完成本关任务，你需要掌握：如何读取。本关任务：编写一个能正则匹配出。本关任务：编写一个能读取。

2025-01-06 22:23:43 1269

原创头歌python多线程编程-进阶部分

初始状态是”未付款“，中间状态有”已付款5毛“，”已付款1块“，”已付款1.5块“，”已足额付款“，四个状态。在下图中，可以看到系统有 S1, S2, S3, S4 四个状态, 0 和 1 是状态机可以从一个状态到另一个状态的值，例如，只有当只为1的时候，S0可以转换到S1，当只为0的时候， S0可以转换到S2。这个转换的过程就是根据条件来切换状态，题目中，我们会输入一组数字作为事件，根据这一组数字，完成状态转换并输出相应的动作，从 S0 开始，叫做初始状态，最后到 S4，叫做结束状态。

2025-01-06 22:13:26 423

原创头歌python实验：多线程编程-基础部分

根据提示，在右侧编辑器补充代码，使用多线程计算给定区间合数的个数。本关已给出素数判定方法，需要你补充主函数中相关内容，实现统计合数个数的相关内容。根据提示，在右侧编辑器补充代码，输出n个foobarpython。本关任务：输入一个数n，打印n个foobarpython。本关任务：使用 Python 多线程，实现求合数的个数。解释：“foobarpython”将输出1次。解释：“foobarpython”将输出5次。本关任务：使用Python多进程求素数个数。

2025-01-06 21:40:53 501

原创头歌python2-2：面向对象程序设计-进阶部分

本关任务：对有理数类Fraction，重载小于等于运算符，实现有理数的相应运算。本关任务：对有理数类Fraction，重载加减运算符，实现有理数的相应运算。测试输入： 1 2 2 4 预期输出： False True。测试输入： 6 9 4 8 预期输出： True False。测试输入： 3 4 2 3 预期输出： 1/12 17/12。

2025-01-03 11:33:02 274

原创头歌实训2-1：面向对象程序设计-基础部分

本关任务：编写银行员工类BankEmployee，要求： 1.银行员工类的属性包括姓名name，工号num，工资salary 2.姓名name和工号num设置为私有属性,并将salay设置为默认参数3000平台会对你编写的代码进行测试：测试输入：张飞 007 预期输出：张飞领到这个月工资3000# 请在此处添加代码 #print(f'{self.__name}领到这个月工资{self.salary}')main()

2025-01-01 14:44:02 510

原创头歌实验1-2：面向过程编程-进阶部分

示例 2：输入：s = "aaa" 输出：6 解释：6个回文子串: "a", "a", "a", "aa", "aa", "aaa"测试输入： 4 4 a b c e a f c s a d e e a d e e dt 预期输出：False。测试输入： 4 4 a b c e a f c s a d e e a d e e fa 预期输出：True。示例 1：输入：s = "abc" 输出：3 解释：三个回文子串: "a", "b", "c"测试输入：cabCbaf 预期输出：9。

2025-01-01 13:06:46 325

原创头歌实训1-1:面向过程编程-基础部分

pbm文件是一种最简单的二值图像文件（即，图像的每个像素的取值，要么是1——对应白；最简单的pbm文件遵循这样的规则 1.第一行是P1 2.第二行，是图像的宽和高的十进制数字，中间以空格间隔 3.像素值，以空格间隔，按从左向右、从上到下的顺序，按行排列 4.从#开始一直到本行结束，全都是注释，不影响图像内容。本关任务：编写一个函数genP1Rect(x, y, w, h)，返回一个字符串，这个字符串表示了黑底中间有白色块的图像。其中 x是图像的宽，y是图像的高 w是白色块的宽，h是白色快的高。

2024-12-31 21:41:36 312

原创头歌python：多进程和多线程

本关任务：编写程序，使用ProcessPoolExecutor并发统计指定范围内的素数个数。本关任务：编写程序，使用进程池统计指定范围内的素数个数。根据提示，在右侧编辑器补充代码，输出指定范围内素数个数。测试输入： 2000 预期输出： 303。测试输入： 5000 预期输出： 669。测试输入： 2000 预期输出： 303。测试输入： 5000 预期输出： 669。

2024-12-31 21:35:27 515

原创头歌python通关：面向对象程序设计

本关任务：某公司有三种类型的员工分别是部门经理、程序员和销售员，需要设计一个工资结算系统根据提供的员工信息来计算月薪，部门经理的月薪是每月固定15000元，程序员的月薪按本月工作时间计算每小时150元，销售员的月薪是1200元的底薪加上销售额5%的提成。你需要编写不同职位的工资结算方法。为了完成本关任务，你需要掌握：1.类和对象，2.装饰器。根据提示，在右侧编辑器补充代码，根据提示，完成，，三个类别的相关内容。根据程序中的提示，完成相应类代码的编写。提示：在本题测试脚本中，初始数据为``` Manag

2024-12-31 21:23:50 946

原创头歌python通关：文件操作和异常处理

预期输出： [{'书名': 'python程序设计', '价钱': '39'}, {'书名': '数据结构', '价钱': '49'}, {'书名': 'C语言程序设计', '价钱': '42'}]本关任务：编写一个将1-9999之间的素数分别写入三个文件中（1-99之间的素数保存在a.txt中，100-999之间的素数保存在b.txt中，1000-9999之间的素数保存在c.txt中）。预期输出： ('A', 8) ('B', 6) ('P', 2) ('L', 1) ('E', 1) ('C', 1)

2024-12-31 21:04:43 1577

原创头歌python关卡：函数与模块

本关任务：编写一个能判断一个正整数数是不是回文数的函数。根据提示，在右侧编辑器补充代码，计算并返回一个数是否为回文数，如是，返回True，如不是，返回False。根据提示，在右侧编辑器补充代码，判断一个数是否为素数，如是素数，返回True，如不是素数，返回False。根据提示，在右侧编辑器补充代码，计算并输出15 位精度的 pi 值。本关任务：编写一个能计算Π值的函数，要求采用莱布尼兹公式方法。本关任务：设计函数参数，编写函数代码实现需要的输出。本关任务：编写一个能判断一个数是否为素数的函数。

2024-12-31 20:27:34 696

原创头歌python通关：流程控制

本关任务：《幸运的基督徒》有15个基督徒和15个非基督徒在海上遇险，为了能让一部分人活下来不得不将其中15个人扔到海里面去，有个人想了个办法就是大家围成一个圈，由某个人开始从1报数，报到9的人就扔到海里面，他后面的人接着从1开始报数，报到9的人继续扔到海里面，直到扔掉15个人。根据提示，在右侧编辑器补充代码，编写一个能实现双色球选号的小程序。双色球选号由7个数字组成y，其中有6个红球，其号码的取值范围为[1,33],一个蓝球的取值范围为[1,16],要求6个红球从小到大排列，蓝球在最后输出。

2024-12-31 19:35:07 547

原创头歌python通关：复合数据类型

本关任务是利用合适的方法快速创建数字列表，并能够对列表中的元素数值进行简单的统计运算。在数据可视化的背景下，数字列表在 Python 列表中的应用十分广泛，列表十分适合存储数字集合。本关目标是让学习者掌握一些处理数字列表的基本方法，主要包括数字列表的创建、对数字列表进行简单的统计运算等。本关的任务是学会列表排序相关操作的使用方法，实现对列表元素的排序。一般情况下我们创建的列表中的元素可能都是无序的，但有些时候我们需要对列表元素进行排序。本关将通过菜名列表的部分复制，让学习者了解并掌握列表切片的基础知识。

2024-12-31 17:33:02 1360

空空如也

空空如也