- 博客(9)
- 问答 (3)
- 收藏
- 关注
原创 SDU软院创新实训开发记录(六)——SAM在医疗领域的应用(微调)
对 SAM(Segment Anything Model)在医学图像数据集上进行微调,旨在提高其在医学图像分割领域的性能,从而为下游应用提供更好的接口。以下是一个简要的步骤指南,涵盖了数据准备、模型微调以及评估的方法:c. 数据加载器定义数据加载器,用于将医学图像和标签数据加载到模型中。d. 定义损失函数和优化器e. 训练模型3. 模型评估a. 验证数据集使用验证数据集评估模型的性能。b. 评价指标使用常用的分割评价指标,如 Dice coefficient、IoU(In
2024-05-30 18:33:45
257
原创 SDU软院创新实训开发记录(四)——SAM大模型的训练(实验展示)
通过引入更高级的数据增强策略、使用预训练模型和迁移学习、高级优化技术、增强损失函数和优化训练策略,可以显著提高SAM模型在RefCOCO数据集上的表现。这些方法结合了最新的研究成果,能够帮助模型更好地学习数据中的复杂特征,提高模型的泛化能力和鲁棒性。通过一系列高级优化策略,我们对SAM模型在RefCOCO数据集上的微调进行了深入的研究。高级数据增强策略:损失从2.30下降到2.10左右,曲线带有轻微波动,表明数据增强策略有效。
2024-05-30 13:01:51
979
原创 SDU软院创新实训开发记录(三)——SAM大模型的训练
一、任务简介我的任务是在RefCOCO系列数据集上对SAM进行微调,那么我首先将介绍一下我们使用的数据集RefCOCO。然后再介绍怎么针对于这个数据集进行微调数据,二、RefCOCO数据集RefCOCO系列数据集是用于图像指令分割任务的基准数据集,包含RefCOCO、RefCOCO+和RefCOCOg三个部分。
2024-05-30 02:00:42
547
2
原创 SDU软院创新实训开发记录(二)——相关技术简介
项目名称:ModuFusion Visionary:实现跨模态文本与视觉的相关推荐目录项目名称:ModuFusion Visionary:实现跨模态文本与视觉的相关推荐一、项目使用的模型介绍1. Segment Anything Model (SAM)2. Segment Everything Everywhere All at Once Model (SEEM)3. 多目标追踪和再识别 (MTTR)4. 稳定扩散 (Stable Diffusion)5. 增强型超分辨率生成
2024-05-29 22:56:19
775
原创 SDU软院创新实训开发记录(一)——项目灵感
比如能直接分割图像上的实体,通过click、box等鼠标操作,也可以通过输入文本检索到特定实体,比如在下图需要检索到嘴里叼着球的小狗(图片来源网络)等多种跨模态操作,简言之,并不仅仅局限于文本和图像的交互。tips:这里只是简单举一个小例子来说明如何进行定位,更有实际效用的生活场景还很多,比如冗长的监控中定位特定动作的人等,这里不再详细介绍,会在后续我们的具体开发场景来详细的介绍。视频是由一帧一帧的图像组成的,则既然可以通过图像来定位实体,那么也同样可以通过多模态交互来定位到整体的视频帧。
2024-04-09 20:30:29
445
空空如也
Linux shell编程
2021-12-02
Java读入txt文件出现了找不到文件的问题
2021-11-09
使用switch可以实现多行读入嘛?
2021-11-04
java中new一个对象,和用构造器有什么区别!
2021-10-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人