- 博客(60)
- 收藏
- 关注
原创 用于医学图像方面的大模型发展历程
参数量突破1B(10亿级),依赖大规模私有医学数据(如NIH ChestX-ray、UK Biobank)。微软提出分层(Hierarchical)Transformer,适用于高分辨率医学图像(如病理切片)。ConVIRT (2022):医学图像-文本对比学习模型(如X-ray与报告对齐)。结合ViT与U-Net,首次在医学图像分割任务(如器官分割)上超越纯CNN方法。完全基于Transformer的3D医学图像分割模型(如CT/MRI体积数据)。支持医学图像问答(如皮肤病变分类、X-ray报告生成)。
2025-03-25 11:42:00
774
原创 python机器学习——新手入门学习笔记
TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的概率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。获取大规模数据集,需要从网络上下载,函数的第一个参数是 data_home,表示数据集下载的目录,默认是~/scikit_learn_data/特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征。某一特定词语的idf,可以由。当0<|r|<1时,表示两变量存在一定程度的相关。
2025-03-24 23:05:18
921
原创 各种医学方面大模型总结一自用
SAM(Segment Anything Model)是由Meta推出的一种人工智能大模型,专注于图像分割任务。它通过创新的设计和训练方法,能够在零样本(zero-shot)条件下快速适应新的图像分布和任务,展现出与完全监督模型相媲美甚至更优的性能。
2025-03-19 17:03:12
672
原创 MAC安装logisim教程(新手级详细教程)
可以通过设置栏的“文件‘打开之前的保存的文件。选择自己喜欢的版本,我用的是3.8.0。页面如上图,不过刚打开应该是英文版的。点击上方windows的偏好这一栏。上面这两个选择一个下载。点击打开就可以使用了。选择cn就是中文版了。
2025-03-15 17:59:42
967
1
原创 深度学习笔记
弱监督语义分割通过利用更简单的标注信息(如图像级标注、物体点标注、物体框标注等)来训练模型,从而实现对图像中物体的像素级预测。语义亲和力在计算机视觉中,特别是在语义分割任务中,通过定义标签亲和力矩阵,并将其与语义标签联系起来,可以辅助训练语义分割网络,提高分割的精度。目标检测(Object Dectection)的任务是找出图像中所有感兴趣的目标(物体),确定他们的类别和位置。在自然语言处理中,语义亲和力可以帮助理解文本中的词汇和句子之间的关系,从而提升文本分析的准确性。3.目标可能有各种不同的形状。
2025-03-14 21:09:04
275
原创 深度学习笔记——验证集和测试集的区别
验证集和测试集在机器学习中扮演着不同的角色:验证集用于模型调参和选择,而测试集用于最终评估模型的泛化能力。测试集:用于评估模型在未见过的数据上的泛化能力,即模型在实际应用中的表现。测试集:在模型训练和验证完成后使用,用于最终评估模型的性能。验证集:通常从训练集中划分出一部分数据,不参与模型的训练,但在训练过程中用于评估模型的性能。测试集:用于最终评估模型的泛化能力,其结果应尽可能无偏,反映模型在真实世界应用场景下的表现。最后,使用测试集评估模型在未见过的数据上的性能。
2025-03-12 16:52:25
1345
原创 深度学习笔记——残差网络和模型选择
提供为什么一个模型好的理论依据,它可以衡量训练误差和泛化误差之间的间隔。2.感知机是一个二分类模型,是最早的AI模型之一·它的求解算法等价于使用批量大小为1的梯度下降它不能拟合XOR函数,导致的第一次 AI寒冬.对于一个分类模型,VC等于一个最大的数据集的大小,不管如何给定标号,都存在一个模型来对它进行完美分类。模型容量:拟合各种函数的能力,低容量的模型难以拟合训练数据,高容量的模型可以记住所有的训练数据。属于深度学习模型的一种,其核心在于让网络的每一层不直接学习预期输出,而是学习与输入之间的残差关系。
2025-03-11 22:48:29
544
原创 深度学习笔记——Resnet和迁移学习
梯度爆炸是指在训练深度神经网络时,通过多层传递的梯度变得非常大,导致权重更新过大,从而使得网络权重的值变得非常大或非常小,这会导致模型的输出变得不稳定。注意力机制(Attention Mechanism)是一种在深度学习模型中模拟人类注意力的机制,它允许模型在处理信息时能够聚焦于当前任务最相关的部分。2.在传统的 CNN 中,每个卷积层试图学习输入与输出之间的映射,即f(x)残差块试图学习输入与输出之间的残差映射,即:H(x)=f(x)-x。最后H(x)与输入x相加,得到输出f(x)=H(x)+x。
2025-03-09 16:23:39
367
原创 深度学习笔记——CNN卷积神经网络
它的核心思想是利用卷积层来提取输入数据的特征,并且能够自动学习到这些特征。表示卷积操作时不进行任何边缘填充,导致输出尺寸缩小。空间不变性:由于权重共享,卷积层能够检测到输入数据中的位置不变特征,即无论特征在输入数据的哪个位置出现,卷积层都能检测到。池化层:通常位于卷积层之后,用于降低数据的空间维度,减少参数数量和计算量,同时增强特征的不变性。全连接层:在网络的末端,将卷积层和池化层提取的特征映射到最终的输出,例如分类标签。共享:同一个卷积核的权重在整个输入数据上是共享的,这大大减少了模型的参数数量。
2025-03-08 17:47:58
324
原创 深度学习笔记——神经网络
模拟生物神经元,人工神经元有1个或者多个输入(模拟多个树突或者多个神经元向该神经元传递神经冲动);线性层(Linear Layer)又称全连接层(Full-connected Layer),其每个神经元与上一层所有神经元相连,实现对前一层的线性组合/线性变换。每个神经元都和前一层中的所有神经元相连,每个神经元的计算方式是对上一层的加权求和的过程。ReLU,全称为:Rectified Linear Unit,是一种人工神经网络中常用的激活函数,通常意义下,其指代数学中的斜坡函数,即f(x)=max(0,x)
2025-03-07 23:32:48
1060
原创 深度学习笔记——基础部分
通过使用图像处理、机器学习、模式识别和深度学习等技术,计算机视觉系统能够识别和处理图像和视频中的对象、场景和事件,执行任务如图像分类、目标检测等,并在自动驾驶、监控、机器人导航等多个领域有着广泛的应用。而在深度学习中,特征提取是自动进行的,通过多层神经网络结构直接从原始数据(也可能需要初步处理)中学习复杂特征,减少了对人工干预的依赖,使得模型能够处理更加复杂的数据和任务。如果两个tensor的维度不同,则在维度较小的tensor的前面增加维度,使它们维度相等。tensor维度不等且其中一个维度为1。
2025-03-07 20:40:39
396
原创 深度学习代码解读——自用
parser.add_argument('--resume', default='init_weights/deeplab-resnet.pth.tar') # 预训练权重。{'params': model.get_10x_lr_params(), 'lr': args.lr * 10} # 分类头高学习率。通过多级伪掩码的融合,可以提升最终分割结果的精度和鲁棒性。{'params': model.get_1x_lr_params(), 'lr': args.lr}, # 骨干网络低学习率。
2025-03-04 22:58:11
1472
原创 深度学习代码分析——自用
{'params': param_groups[2], 'lr': 10*args.lr, 'weight_decay': args.wt_dec}, # 分类头(高学习率){'params': param_groups[0], 'lr': args.lr, 'weight_decay': args.wt_dec}, # 主干网络(低学习率)avg_meter = pyutils.AverageMeter('loss', 'avg_ep_EM', 'avg_ep_acc') # 统计训练指标。
2025-03-03 20:20:04
1070
原创 代码的解读——自用
利用分类模型生成 3 种级别的伪分割掩码(如 CAM、边界增强掩码等)。:使用伪掩码训练 DeepLab v3+ 分割模型,完成像素级分割任务。:DeepLab v3+ 的预训练权重路径(ImageNet 预训练)。:训练一个基于 ResNet38 的多标签分类模型,生成图像级标签。:使用伪掩码训练 DeepLab v3+ 分割模型,实现像素级预测。:利用 Stage1 的模型生成 3 种级别的伪分割掩码。:加载 Stage1 的模型权重(用于初始化部分参数)。:Stage1 训练好的分类模型权重路径。
2025-03-02 23:07:26
899
原创 一些阅读医学图像切割的论文时常用到的专有词汇
是一种重要的机器学习方法,其核心在于通过已知的输入特征来预测对应的标签。训练数据没有外部给定的标签,但是模型可以通过一些辅助任务(pretext)来自动生成一些内部的标签,然后用这些内部标签来训练模型,从而学习到数据的内在表示(representation),再用这些表示来做下游任务(downstream),例如在图像上做旋转预测或遮挡恢复等辅助任务,然后用得到的特征向量来做分类或检测等下游任务。训练数据都有完整和准确的标签,模型通过学习输入数据和标签之间的映射关系来完成特定的任务,例如分类、回归等。
2025-03-02 22:56:27
867
原创 深度学习笔记——线性回归的从0开始实现
三种图像分割任务(语义、实例和全景分割)为图像中的各个像素分配标签,以标记图像中不同对象和区域的特定边界和形状,并使用颜色、对比度、图像中的位置和其他属性等信息对它们进行分类。而GPU并行计算的能力需要CUDA借助其自带的编程接口和工具,比如C/C++语言来编写并行计算程序,并通过CUDA编译器将程序转化为可以在英NVIDIA GPU上执行的机器码快速运行。(英语:Hyperparameter)是事先给定的,用来控制学习过程的参数。在深度学习中,超参数有:学习速率,迭代次数,层数,每层神经元的个数等等。
2025-03-02 22:56:03
1155
原创 深度学习笔记——线性回归,基础优化方法
可以看作是单层神经网络,神经网络源于神经科学,与真实的神经元类似。参数学习:训练损失,最小化损失来学习参数。选择学习率:学习率不能太大,也不能太小。选择批量大小:不能太大,也不能太小。收集训练:数据越多越好。显示解:将偏差加入权重。
2025-02-27 00:16:34
173
原创 深度学习笔记数学方面——矩阵计算,自动求导
9.梯度是一个向量,是一个n元函数f关于n个变量的偏导数,梯度会指向各点处的函数值降低的方向。更严格的讲,梯度指示的方向是各点处的函数值减少最多的方向。深度学习中, 神经网络的主要任务是在学习时找到最优的参数(权重和偏置),这个最优参数也就是损失函数最小时的参数。但是,一般情况下,损失函数比较复杂,参数也很多,无法确定在哪里取得最小值。该框架具备高度可扩展性,可以进行快速的模型训练,并支持灵活的编程模型和多种语言。4.自动求导,计算一个函数在指定值上的导数,有别于符号求导,数值求导(高数中的)
2025-02-26 22:55:38
353
原创 深度学习笔记线性代数方面,记录一些每日学习到的知识
我们知道距离的定义是一个宽泛的概念,只要满足非负、自反、三角不等式就可以称之为距离。torch.arange()为左闭右开,即[start, end),torch.range()为左闭右闭,即[start, end],用于根据步长创建一维tensor。jupyter:Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享程序文档,支持实时代码,数学方程,可视化和。torch:Torch是一个有大量机器学习算法支持的科学计算框架,是一个与Numpy类似的张量(Tensor)操作库。
2025-02-25 23:47:49
401
原创 深度学习笔记——数据操作
NumPy(Numerical Python) :是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。标量是 0维空间中的一个点 ,向量是 一维空间中的一条线 ,矩阵是 二维空间的一个面 ,三维张量 是三维空间中的一个体。也就是说,向量是由标量组成的,矩阵是向量组成的,张量是矩阵组成的。广播机制:广播(Broadcast)是numpy 对不同形状(shape)的数组进行数值计算的方式, 对数组的算术运算通常在相应的元素上进行。
2025-02-24 22:11:36
330
转载 深度学习之学习笔记———CNN、RNN、DNN
每一层的卷积层都会对输入的数据进行局部感受野的扫描,通过滤波器提取特征,然后通过激活函数(比如ReLU)引入非线性,使得网络能够学习复杂的特征表示。RNN的核心在于它的循环连接,这使得它能够记住之前的信息,并用这些信息来预测下一个输出。CNN的结构特别适合处理具有网格结构的数据,比如图像。DNN的应用非常广泛,它是一种通用的解决方案,适用于各种复杂的模式识别任务,比如语音识别、自然语言处理、推荐系统等。RNN的最大特点是它的循环结构,这使得它能够处理序列数据,并且能够在序列的不同时间点之间传递信息。
2025-01-19 20:13:09
350
原创 头歌python实验:网络安全应用实践3-验证码识别
来说识别率较低,一些图片里有很对五颜六色扰乱识别的点,非常影响识别率。可运用数字图像处理的方法,对图片进行灰度处理,然后再进行去除噪点处理。的全屏截图,请同学们在自己电脑上定位此页面验证码的坐标,在实验环境用坐标从截图中切割出验证码,对此页面的验证码进行识别并输出。平台会对你编写的代码进行测试,分别对两张全屏页面截图进行识别,两张全屏截图的验证码不一样,坐标一样,当两个测试集通过即可通关。读取图像文件,如果图像是不相容的,会先转换成兼容的格式,然后再提取图片中的文本信息。,输出图像的文字识别结果即可。
2025-01-06 22:34:51
1054
原创 头歌python实验:网络安全应用实践2-计算机取证
请你在这个函数中读取指定新闻稿的元数据,并将其按照<属性名> : <属性值>的格式打印出来。函数,尝试各种数字、字母组合,成功解压时返回相应的压缩密码。函数中,尝试破解这个文件的密码,并将其密码返回。的名字,然后以此为证据将其逮捕,也就是所谓的电子取证。函数,期间产生的输出将会与规定的输出进行比较,详细要求请见测试说明。函数,期间产生的输出将会与规定的输出进行比较,详细要求请见测试说明。,如果解压成功,则会输出解压成功,否则会输出解压失败。注意,这个模块的名字对大小写是敏感的,所以,确保。
2025-01-06 22:29:50
1102
原创 头歌python实验:网络安全应用实践-恶意流量检测
文件是常用的数据报存储格式,可以理解为就是一种文件格式,只不过里面的数据是按照特定格式存储的,所以我们想要解析里面的数据,也必须按照一定的格式。,需要检测其中的恶意流量。请对其进行检测并按返回测试说明的格式返回。函数,期间产生的输出将会与规定的输出进行比较,详细要求请见测试说明。为了完成本关任务,你需要掌握:1.re库的使用,2.pcap包的读取。平台会对你编写的代码进行测试: 代码请写在。为了完成本关任务,你需要掌握:如何读取。本关任务:编写一个能正则匹配出。本关任务:编写一个能读取。
2025-01-06 22:23:43
1220
原创 头歌python多线程编程-进阶部分
初始状态是”未付款“,中间状态有”已付款5毛“,”已付款1块“,”已付款1.5块“,”已足额付款“,四个状态。在下图中,可以看到系统有 S1, S2, S3, S4 四个状态, 0 和 1 是状态机可以从一个状态到另一个状态的值,例如,只有当只为1的时候,S0可以转换到S1,当只为0的时候, S0可以转换到S2。这个转换的过程就是根据条件来切换状态,题目中,我们会输入一组数字作为事件,根据这一组数字,完成状态转换并输出相应的动作,从 S0 开始,叫做 初始状态,最后到 S4,叫做结束状态。
2025-01-06 22:13:26
416
原创 头歌python实验:多线程编程-基础部分
根据提示,在右侧编辑器补充代码,使用多线程计算给定区间合数的个数。本关已给出素数判定方法,需要你补充主函数中相关内容,实现统计合数个数的相关内容。根据提示,在右侧编辑器补充代码,输出n个foobarpython。本关任务:输入一个数n,打印n个foobarpython。本关任务:使用 Python 多线程,实现求合数的个数。解释:“foobarpython”将输出1次。解释:“foobarpython”将输出5次。本关任务:使用Python多进程求素数个数。
2025-01-06 21:40:53
434
原创 头歌python2-2:面向对象程序设计-进阶部分
本关任务:对有理数类Fraction,重载小于等于运算符,实现有理数的相应运算。本关任务:对有理数类Fraction,重载加减运算符,实现有理数的相应运算。测试输入: 1 2 2 4 预期输出: False True。测试输入: 6 9 4 8 预期输出: True False。测试输入: 3 4 2 3 预期输出: 1/12 17/12。
2025-01-03 11:33:02
250
原创 头歌实训2-1:面向对象程序设计-基础部分
本关任务:编写银行员工类BankEmployee,要求: 1.银行员工类的属性包括姓名name,工号num,工资salary 2.姓名name和工号num设置为私有属性,并将salay设置为默认参数3000平台会对你编写的代码进行测试:测试输入: 张飞 007 预期输出: 张飞领到这个月工资3000# 请在此处添加代码 #print(f'{self.__name}领到这个月工资{self.salary}')main()
2025-01-01 14:44:02
471
原创 头歌实验1-2:面向过程编程-进阶部分
示例 2: 输入:s = "aaa" 输出:6 解释:6个回文子串: "a", "a", "a", "aa", "aa", "aaa"测试输入: 4 4 a b c e a f c s a d e e a d e e dt 预期输出:False。测试输入: 4 4 a b c e a f c s a d e e a d e e fa 预期输出:True。示例 1: 输入:s = "abc" 输出:3 解释:三个回文子串: "a", "b", "c"测试输入:cabCbaf 预期输出:9。
2025-01-01 13:06:46
302
原创 头歌实训1-1:面向过程编程-基础部分
pbm文件是一种最简单的二值图像文件(即,图像的每个像素的取值,要么是1——对应白;最简单的pbm文件遵循这样的规则 1.第一行是P1 2.第二行,是图像的宽和高的十进制数字,中间以空格间隔 3.像素值,以空格间隔,按从左向右、从上到下的顺序,按行排列 4.从#开始一直到本行结束,全都是注释,不影响图像内容。本关任务:编写一个函数genP1Rect(x, y, w, h),返回一个字符串,这个字符串表示了黑底中间有白色块的图像。其中 x是图像的宽,y是图像的高 w是白色块的宽,h是白色快的高。
2024-12-31 21:41:36
294
原创 头歌python:多进程和多线程
本关任务:编写程序,使用ProcessPoolExecutor并发统计指定范围内的素数个数。本关任务:编写程序,使用进程池统计指定范围内的素数个数。根据提示,在右侧编辑器补充代码,输出指定范围内素数个数。测试输入: 2000 预期输出: 303。测试输入: 5000 预期输出: 669。测试输入: 2000 预期输出: 303。测试输入: 5000 预期输出: 669。
2024-12-31 21:35:27
457
原创 头歌python通关:面向对象程序设计
本关任务:某公司有三种类型的员工 分别是部门经理、程序员和销售员,需要设计一个工资结算系统 根据提供的员工信息来计算月薪,部门经理的月薪是每月固定15000元,程序员的月薪按本月工作时间计算每小时150元,销售员的月薪是1200元的底薪加上销售额5%的提成。你需要编写不同职位的工资结算方法。为了完成本关任务,你需要掌握:1.类和对象,2.装饰器。根据提示,在右侧编辑器补充代码,根据提示,完成,,三个类别的相关内容。根据程序中的提示,完成相应类代码的编写。 提示:在本题测试脚本中,初始数据为``` Manag
2024-12-31 21:23:50
914
原创 头歌python通关:文件操作和异常处理
预期输出: [{'书名': 'python程序设计', '价钱': '39'}, {'书名': '数据结构', '价钱': '49'}, {'书名': 'C语言程序设计', '价钱': '42'}]本关任务:编写一个将1-9999之间的素数分别写入三个文件中(1-99之间的素数保存在a.txt中,100-999之间的素数保存在b.txt中,1000-9999之间的素数保存在c.txt中)。预期输出: ('A', 8) ('B', 6) ('P', 2) ('L', 1) ('E', 1) ('C', 1)
2024-12-31 21:04:43
1414
原创 头歌python关卡:函数与模块
本关任务:编写一个能判断一个正整数数是不是回文数的函数。根据提示,在右侧编辑器补充代码,计算并返回一个数是否为回文数,如是,返回True,如不是,返回False。根据提示,在右侧编辑器补充代码,判断一个数是否为素数,如是素数,返回True,如不是素数,返回False。根据提示,在右侧编辑器补充代码,计算并输出15 位精度的 pi 值。本关任务:编写一个能计算Π值的函数,要求采用莱布尼兹公式方法。本关任务:设计函数参数,编写函数代码实现需要的输出。本关任务:编写一个能判断一个数是否为素数的函数。
2024-12-31 20:27:34
669
原创 头歌python通关:流程控制
本关任务:《幸运的基督徒》 有15个基督徒和15个非基督徒在海上遇险,为了能让一部分人活下来不得不将其中15个人扔到海里面去,有个人想了个办法就是大家围成一个圈,由某个人开始从1报数,报到9的人就扔到海里面,他后面的人接着从1开始报数,报到9的人继续扔到海里面,直到扔掉15个人。根据提示,在右侧编辑器补充代码,编写一个能实现双色球选号的小程序。双色球选号由7个数字组成y,其中有6个红球,其号码的取值范围为[1,33],一个蓝球的取值范围为[1,16],要求6个红球从小到大排列,蓝球在最后输出。
2024-12-31 19:35:07
528
原创 头歌python通关:复合数据类型
本关任务是利用合适的方法快速创建数字列表,并能够对列表中的元素数值进行简单的统计运算。在数据可视化的背景下,数字列表在 Python 列表中的应用十分广泛,列表十分适合存储数字集合。本关目标是让学习者掌握一些处理数字列表的基本方法,主要包括数字列表的创建、对数字列表进行简单的统计运算等。本关的任务是学会列表排序相关操作的使用方法,实现对列表元素的排序。一般情况下我们创建的列表中的元素可能都是无序的,但有些时候我们需要对列表元素进行排序。本关将通过菜名列表的部分复制,让学习者了解并掌握列表切片的基础知识。
2024-12-31 17:33:02
1318
原创 头歌python代码关卡:基本数据类型
本关任务:编写一个能计算字符串摘要值的小程序。平台会对你编写的代码进行测试:hello;预期输出: aaf4c61ddcc5e8a2dabede0f3b482cd9aea9434d#请输出str1的sha1值第2关:计算两个字符串的消息摘要值本关任务:编写一个能计算两个字符串连接的摘要值的小程序。平台会对你编写的代码进行测试:测试输入:hellopython预期输出:#请输出str1和str2连接后的sha256的值。
2024-12-31 17:12:53
661
原创 PTA数据结构作业三
BinTree CreateBinTree_NRecursion() 实现对二叉树的非递归建立void LevelOrder(BinTree bt) 层次遍历二叉树bt实现流程:(1) 建立二叉树在建立二叉树时,用先序遍历的方式,输入的是扩展二叉树,也就是要告诉计算机什么是叶结点,否则将一直递归,当输入“#”时,指针指向NULL,说明是叶结点。(2) 层次遍历二叉树①创建空队列②根结点不为空,根结点入队③队列不空,循环执行操作while(!④去队头元素,出队;
2024-12-31 15:55:40
350
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅