一、前言
经过两天时间的组内讨论,我和其他队员对于本次项目有了较为初步的认知,并确定了个人分工以及第一阶段的相关内容。
二、个人任务
我的任务是担任队长,负责给组内成员进行合理分工。同时我与团队成员宗亚静合作负责对XrayGLM模型进行微调,使它能够正确识别胸部X光片数据集,并给出对应的症状描述,最后实现一个用户友好的前端页面,让用户能方便的与XrayGLM模型进行交流对话。
目前我们第一阶段的任务如下:
1.收集并整理医学领域的相关资料,了解胸部X光片数据集诊疗报告的需求和应用场景。
2.进行需求调研,与山东大学医学院的师生进行交流,获取他们对于医疗问答和癌症图像检测系统的具体需求和期望。
3.收集X光影像-诊断报告数据集,包括各种类型和阶段的图像,并进行标注和预处理等操作。
我主要负责任务1和任务3
三、任务预期
任务1:收集并整理医学领域的相关资料,了解CT肿瘤图像检测的需求和应用场景
1.1 资料收集
- 医学文献与期刊: 利用医学数据库如PubMed、CNKI等,检索与胸部X光片数据集图像检测和识别相关的文献和期刊文章。重点关注近五年的研究,确保资料的时效性和前沿性。
- 学术会议资料: 收集近年来与医学影像、胸部X光片相关的学术会议资料,特别关注会议上的最新研究成果和技术进展。
- 网络资源: 通过搜索引擎和医学类网站,收集有关胸部X光片和对应诊疗报告的技术文章、应用案例和用户评价。
1.2 资料整理
- 分类与归纳: 将收集到的资料按照研究内容、方法、应用场景等进行分类,并归纳出主要的研究热点和趋势。
- 提取关键信息: 从资料中提取出与-诊断X光影像报告需求和应用场景相关的信息,如现有技术的优缺点、市场需求、应用场景的局限性等。
- 制作资料汇编: 将整理好的资料整理成电子文档或PPT形式,方便后续查阅和分析。
1.3 需求分析与应用场景研究
- 需求调研: 通过问卷调查、访谈等方式,向医学影像科医生、肿瘤学专家等了解他们对CT肿瘤图像检测的需求和期望。
- 应用场景分析: 结合资料整理的结果和调研数据,分析X光影像-诊断报告在不同医疗机构、不同疾病类型中的应用场景,以及可能存在的问题和挑战。
任务3:收集X光影像-诊断报告数据集,包括各种类型和阶段的图像,并进行标注和预处理等操作
2.1 数据集收集
- 公开数据集: 查找并下载与X光影像-诊断报告相关的公开数据集,这些数据集通常经过初步的处理和标注,可以作为基础数据使用。
2.2 数据标注
- 标注工具选择: 根据数据类型和标注需求选择合适的标注工具,如Labelme、ITK-SNAP等。
- 标注规范制定: 制定详细的标注规范,包括标注的内容、格式、精度等要求,确保标注的一致性和准确性。
- 标注人员培训: 对参与标注的人员进行培训,使他们熟悉标注工具和规范,提高标注的质量和效率。
2.3 数据预处理
- 格式转换: 将收集到的图像数据转换为统一的格式,便于后续的处理和分析。
- 噪声去除: 利用滤波器等方法去除图像中的噪声和伪影,提高图像质量。
- 图像增强: 通过对比度增强、直方图均衡化等方法改善图像的视觉效果和特征提取效果。
- 数据分割: 将数据集按照一定比例分割为训练集、验证集和测试集,用于后续的模型训练和评估。
2.4 数据质量检查
- 标注质量检查: 对标注结果进行抽查和审核,确保标注的准确性和完整性。
- 数据完整性检查: 检查数据集中是否存在缺失或损坏的图像文件,及时进行处理和补充
四、总结
通过完成以上两个任务,我们将能够全面了解X光影像-诊断报告的需求和应用场景,并建立起一个丰富多样的数据集。这些数据将为后续的模型训练和算法优化提供坚实的基础。