自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 (多模态医疗)OphGLM: 基于指令和对话训练眼科大型语言和视觉助手

OphGLM由眼底诊断管道和OphGLM管道组成。眼底诊断管道主要进行图像的分类和分割,这些部分协同工作,从输入的眼底图像中提取信息。提取的视觉信息被集成到结构化文本模板中,根据输入的眼底图像形成诊断报告;OphGLM管道,它通过文本拼接过程将眼底图像诊断报告与用户输入的眼底对话合并。这形成一个提示,然后输入 OphGLM,最终生成高质量的响应。整体架构如图3所示。

2023-10-23 09:53:22 338

原创 (多模态医疗) CephGPT-4:采用视觉大语言模型的交互式多模态头影测量和诊断系统

在本文中,我们提出了一种新颖的多模态头影测量分析和诊断对话模型。首先,构建多模态正畸医学数据集,包括头影测量图像和医患对话数据,使用U-net自动分析头影测量标志并生成诊断报告。然后,头影测量数据集和生成的诊断报告分别在 Minigpt-4 和 VisualGLM 上进行微调。

2023-10-16 10:34:20 289

原创 MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models

MiniGPT-4论文理解即概述

2023-09-22 11:49:04 195 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除