小罗碎碎念
本期文献速递的主题——人工智能在精准医学、抗肿瘤药物以及基因组学中的最新进展。
重点关注:第一篇和第六篇文献
这俩文献重点关注的都是数据之间存在的偏见,倡导医疗的公平性。其实这个观点很常见了,最初的版本是黑人与白人之间存在偏差,后面逐渐的上升到如今的不同国家层面。
用大白话说就是,穷人有些检查做不起,我们能收集到的数据大多来源于物质条件比较好的患者。这就会导致利用这批数据训练出的模型不适用于物质条件较差的那一批患者,因为模型最开始对于这一部分人的训练数据就少,模型的泛化性自然不会好。
小罗的想法是,我们先不去考虑不同国家人群的区别,我们先解决那些明显呈现地域性分布的肿瘤吧。我们现在都倡导多中心合作,但是说句不好听的话,大家资源断层了,都只在自己的圈子玩,我们自己亲手给自己造就了数据类别不平衡的难题。
怎么解决呢?小罗觉得可以试试“从群众中来,到群众中去”,给基层的医生和医院一个参与的机会,他们面向的患者群体更大,承担的医疗压力其实也更大。
重点关注:第五篇文献
看标题可能觉得这篇文章和大部分研究肿瘤的老师/同学没有借鉴价值,但是我在文献概述部分做了两个补充:
- 孟德尔随机化分析
- “遗传性”在肿瘤治疗中的影响
第一个孟德尔随机化分析,我在公众号天天刷到,总喜欢用这个做标题博眼球,哈哈。但是,这个方法确实有它的价值,还是值得想一想如何结合起来的。
第二个“遗传性”才是我重点想关注的,这个和现在的热点都能扯上些关系——肿瘤微环境、个性化治疗以及靶向治疗等等。并且还有一个很重要的应用场景——癌症的早期筛查&地域性分布。
小罗由于是工科出身,才踏入这个领域半年多,临床知识短期很难追上来,所以只能通过这种方式和大家交流了,如果有明显错误的地方,还麻烦各位前辈及时指正!!谢谢!!
我是罗小罗同学,我们明天见咯!!
交流群
欢迎大家来到【医学AI】交流群,本群设立的初衷是提供交流平台,方便大家后续课题合作。
建议优先添加中间
个人微信,如果提示添加好友过多,可以添加右侧
备用微信。
一、新型放疗研究,解决中低收入国家面临的癌症治疗挑战
文献概述
这篇文章是《The Lancet Oncology》2024年6月的一篇系列论文中的第四篇,专注于低收入和中等收入国家(LMICs)在放射治疗研究方面的挑战和创新机会。
以下是文章的主要内容概括:
-
背景:癌症是全球主要死因之一,2020年导致996万人死亡,其中71%发生在LMICs。放射治疗是治疗常见癌症的有效且经济的干预手段,但在LMICs的研究和创新面临挑战。
-
LMICs的当前研究状况:全球癌症负担上升,预计到2030年,LMICs将承受近75%的癌症死亡。LMICs的癌症治疗、预防和疗效证据往往基于高收入国家(HICs)的情况,并不总是适用于LMICs,因为癌症的类型和流行情况存在差异。
-
研究和创新的挑战:LMICs在放射治疗研究方面面临数据缺乏、临床试验可用性低、研究友好环境不足等挑战。此外,还有临床试验参与者安全问题、患者保护不完善、昂贵但有效药物的获取困难、物流限制、复杂的监管环境、资金稀缺等问题。
-
研究资金和能力调查:国际原子能机构(IAEA)进行了一项研究能力调查,发现在研究基础设施、人力资源和受保护的研究时间方面存在显著差异。高收入国家的受访者在5年内发表的研究文章数量多于LMICs的受访者。
-
创新机会:文章探讨了深度表型分析、实时定位和人工智能等发展,以标记对资源受限环境具有适用性和相关性的具体机会。
-
放射治疗质量和临床试验质量保证:强调了治疗质量对于任何放射医学项目的基础性重要性,并讨论了通过质量保证进行反馈和学习以改善护理的方法。
-
放射生物学和正常组织毒性建模:讨论了将放射治疗引发的生物学过程与肿瘤特征整合的必要性,以及正常组织毒性建模对于LMICs的重要性。
-
医学物理和图像引导:强调了准确结构成像在成功放射治疗中的重要性,并讨论了实时定位和适应方面的创新。
-
粒子束放射治疗:讨论了图像引导放射治疗在减少毒性、增加剂量、低分割和实时适应放射治疗方面的进展。
-
放射治疗作为系统治疗:探讨了空间分数放射治疗等技术,并讨论了其在LMICs中的潜在应用。
-
价值框架和资源节约:讨论了在放射肿瘤学中开发价值框架的重要性,并提供了节省资源的研究机会的例子。
-
未来研究方向:强调了在LMICs进行老年放射肿瘤学、放射治疗与免疫治疗结合、人工智能在放射肿瘤学中的应用等方面的研究需求。
文章呼吁全球放射专业人员关注LMICs在放射治疗领域面临的挑战,并利用放射治疗的力量改善癌症护理。
重点关注
表1 展示了根据国家收入水平分层的受访者特征。
以下是对表中数据的分析:
-
受访者数量:
- 低收入国家(Lower-middle-income countries):10位受访者
- 中等收入国家(Upper-middle-income countries):9位受访者
- 高收入国家(High-income countries):5位受访者
-
受访者平均年龄:
- 低收入国家:53.7岁(标准差6.83)
- 中等收入国家:48.1岁(标准差10.53)
- 高收入国家:51.2岁(标准差10.94)
-
受访者性别比例:
- 低收入国家:70%男性,30%女性
- 中等收入国家:44%男性,56%女性
- 高收入国家:60%男性,40%女性
-
受访者专业背景:
- 放射肿瘤学家:低收入国家40%,中等收入国家89%,高收入国家60%
- 临床肿瘤学家:低收入国家50%,中等收入国家11%,高收入国家20%
- 科学家:低收入国家10%,中等收入国家0%,高收入国家20%
-
完成培训后的平均年数:
- 低收入国家:23.5年(标准差8.92)
- 中等收入国家:21.9年(标准差5.23)
- 高收入国家:20.6年(标准差10.95)
-
实践环境:
- 学术机构:低收入国家100%,中等收入国家78%,高收入国家100%
- 社区癌症中心和综合医院:在低收入和中等收入国家没有受访者,高收入国家有22%的受访者来自综合医院。
-
受访者来源国家:
- 低收入国家的受访者来自埃及、加纳、印度、吉尔吉斯斯坦、乌克兰、越南和赞比亚。
- 中等收入国家的受访者来自阿根廷、亚美尼亚、巴西、中国、格鲁吉亚、约旦、秘鲁和泰国。
- 高收入国家的受访者来自加拿大、克罗地亚、意大利、日本和西班牙。
表1提供了对不同收入水平国家的放射肿瘤学研究者特征的深入了解,包括他们的年龄、性别、专业背景和工作实践环境。这些数据有助于识别全球放射肿瘤学研究中存在的不平等,并为改善LMICs的研究能力和参与度提供依据。
二、关注新兴抗癌药物、应用于成像的人工智能以及心力衰竭的新治疗靶点
文献概述
这篇文章是关于心血管疾病治疗和研究的综述,重点关注了以下几个领域:
-
新兴癌症药物:讨论了过去十年癌症治疗的转变,从非特异性的细胞毒性化疗到针对特定分子机制的药物,以及这些治疗可能带来的心血管毒性问题。
-
肺栓塞(PE)的治疗:介绍了
导管基础治疗
(CBTs)作为肺栓塞患者的治疗选择,并分析了在高风险或中风险PE患者中使用CBT与不使用CBT的住院和再入院结果。 -
心脏结构异常的早期识别:强调了使用胸部X光片(CXRs)通过深度学习方法来识别心脏结构异常的重要性,这些异常可能表明心力衰竭。
-
深度学习在胸部X光片分析中的应用:介绍了一种深度学习模型,该模型能够从胸部X光片中识别出左心室结构异常,并与15位放射科医生的评估结果进行了比较。
-
MicroRNA-21(miR-21)在心脏疾病中的作用:探讨了miR-21在心脏纤维化和炎症中的作用,以及抑制miR-21对人类衰竭心肌的潜在保护效果。
-
心肌瘢痕和心脏重塑:讨论了心肌瘢痕和心脏重塑作为严重主动脉瓣狭窄患者长期死亡率预测因子的重要性。
文章还包含了一些相关的评论和编辑意见,强调了高质量观察数据、基本原理的推断和临床共识在难以随机化和当前结果不佳的领域中的指导作用。此外,文章还提到了人工智能在心血管疾病研究和临床试验中的应用,并强调了创建可信AI的重要性。
重点关注
Figure 2 描述了一个深度学习模型的开发和性能评估,该模型用于从胸部X光片中检测心脏结构异常。
以下是对这一部分内容的分析:
-
模型输入:模型接收的输入数据包括经过预处理的胸部X光片(尺寸为224×224像素)、年龄和性别。
-
模型输出:模型输出的是以下几项的概率:
- 左心室扩大(Dilated Left Ventricle, DLV)
- 严重左心室肥厚(Severe Left Ventricular Hypertrophy, SLVH)
- 综合标签(composite label),指示存在上述任何一种结构异常。
-
性能对比:该模型在检测上述异常(综合标签)的任务中,性能超过了所有15位获得认证的放射科医生。具体来说,模型与放射科医生的共识投票(consensus vote)相比,模型的敏感性(sensitivity)为71%,而共识投票的敏感性为66%,同时在固定的特异性(specificity)为73%的情况下进行比较。
-
性能指标:敏感性是指模型正确识别异常存在的能力,特异性是指模型正确识别没有异常的能力。在这个案例中,模型在保持较高特异性的同时,具有比人类医生更高的敏感性。
-
模型内部机制:Saliency maps(显著性图)显示,在网络的较浅层,模型对于心脏的整体轮廓以及左心结构较为敏感。这表明模型能够识别出与心脏结构异常相关的图像特征。
-
专业术语解释:
- AI:人工智能(Artificial Intelligence)
- AUROC:接收者操作特征曲线下面积(Area Under the Receiver Operating Characteristic curve),是评估分类模型性能的一个指标。
- CXR:胸部X光片(Chest X-ray)
- DLV:左心室扩大
- IVSd:舒张末期室间隔厚度(Interventricular Septal Thickness at End-Diastole)
- LVIDd:舒张末期左心室内径(Left Ventricular Internal Diameter at End-Diastole)
- LVPWd:舒张末期左心室后壁厚度(Left Ventricular Posterior Wall distance at End-Diastole)
- SLVH:严重左心室肥厚
-
研究贡献:这项研究展示了深度学习在医学图像分析中的应用潜力,特别是在提高心脏疾病早期诊断的准确性方面。
通过这项研究,我们可以看到人工智能在医疗领域,特别是在心血管疾病诊断中的巨大潜力,以及它可能对提高诊断准确性和效率产生的积极影响。
三、打开精准医学之门:评估炎症性肠病和结肠炎相关肿瘤肠屏障的新型工具
文献概述
这篇文章是关于
炎症性肠病
(IBD)和结肠炎
相关癌症(CRC)的研究进展,特别关注了肠道屏障
在这些疾病中的作用以及如何通过精准医疗的新工具进行评估和治疗。
-
肠道屏障的重要性:肠道屏障与饮食和肠道微生物组的复杂网络在IBD和CRC的发病机制中扮演关键角色。肠道屏障与肝脏和大脑的双向联系,即
肠脑轴
,在IBD的肠外表现和CRC转移的发展中起着重要作用。 -
新工具和技术:文章介绍了一些新技术,如超高清放大内窥镜和基于探针的共聚焦激光内窥显微镜,这些技术能够实时探索肠道屏障的细胞层面。此外,还有先进的空间成像技术平台,包括多光谱成像、上转换纳米粒子、数字空间分析、光学光谱学和质谱细胞学,这些技术能够深入全面地评估肠道屏障的分子和超微结构。
-
人工智能的作用:在标准化和整合这些新工具方面,人工智能起着关键作用,有助于肠道屏障的评估和预测治疗结果。
-
IBD的多方面影响:IBD是一种多方面的慢性疾病,严重影响患者的生活质量,并可能导致多种并发症,包括结肠炎相关异型增生和CRC。
-
肠道屏障与饮食和微生物组的相互作用:饮食摄入深刻影响肠道屏障,特定的饮食成分可能损害肠道上皮细胞间的紧密连接,增加肠道通透性并触发炎症。西方饮食模式导致的微生物组失衡,增加了促炎菌群,破坏了肠道屏障功能。
-
肠脑轴和肠肝轴:肠道屏障功能障碍不仅影响局部疾病,还通过肠脑轴显著影响全身,包括大脑和肝脏,以及CRC的转移风险。
-
评估肠道屏障的工具:传统上,肠道屏障的评估依赖于间接方法,但新工具的开发使得能够更直接、全面地评估肠道屏障,预测治疗反应和疾病结果。
-
治疗前景:针对肠道屏障、饮食和微生物组的干预为IBD的个性化治疗提供了新的视角,包括新分子、饮食干预和微生物组调节策略,旨在恢复、加强或调节肠脑轴。
文章强调了通过整合这些先进的技术和方法,可以为IBD患者提供更个性化的医疗策略,并可能发现新的治疗靶点。
重点关注
肠道屏障在健康状态和炎症性肠病(IBD)中的对比示意图。
以下是对该图的分析:
-
健康肠道屏障:左侧展示了健康状态下的肠道屏障,其中包括:
- 粘液层:作为第一道防线,防止微生物穿过。
- 上皮屏障:由肠道上皮细胞构成,紧密连接(tight junctions,TJs)增强了屏障的完整性。
- 免疫细胞:位于固有层(lamina propria)中,参与局部免疫反应。
- 血管屏障:维持肠道内的血液和外界环境分离。
图示中,健康的肠道屏障通过免疫荧光染色显示了紧密连接蛋白ZO-1的表达,证实了上皮屏障(EB)和血管屏障(VB)的完整性。
-
IBD中的受损肠道屏障:右侧展示了IBD状态下受损的肠道屏障,特点包括:
- 粘液层减少:减弱了对微生物的第一道防线。
- 紧密连接破坏:导致肠道通透性增加,允许有害微生物穿过上皮细胞层进入固有层。
- 免疫细胞的激活:在固有层中,有害微生物的存在触发了炎症反应。
- 血管屏障受损:导致微生物和炎症介质能够穿过血管屏障进入血液循环。
图示中,IBD状态下的免疫荧光染色显示了ZO-1的表达受损,反映了上皮屏障和血管屏障的破坏。
-
病理联系:受损的肠道屏障与IBD的发展和并发症有关,也可能与结直肠癌(CRC)的发生有关。肠道屏障的完整性丧失可能导致慢性炎症和疾病进展。
-
图像创作:该图由‘Biorender.com’创建,这是一种常用于科学出版物中的生物医学插图工具。
总之,Figure 1 强调了肠道屏障的完整性对于维持肠道健康的重要性,以及在IBD中如何因为屏障功能受损而导致疾病的发展。
四、放射性药物科学在肿瘤学领域的最新进展和即将面临的挑战
文献概述
这篇文章是《The Lancet Oncology》2024年6月的一篇系列论文中的第一篇,主要讨论了放射性药物科学在肿瘤学领域的最新进展和即将面临的挑战。
文章由Suzanne E Lapi、Peter J H Scott、Andrew M Scott、Albert D Windhorst、Brian M Zeglis等多位专家合著,涵盖了放射性药物的当前发展状况、在肿瘤诊断和治疗中的应用、以及人工智能在该领域的应用。
文章强调了放射性药物在肿瘤治疗中的重要性,特别是在精准医疗和个体化治疗方面。放射性药物结合了放射性核素和载体分子,可以针对肿瘤组织进行精准照射,同时减少对健康组织的伤害。文章讨论了放射性药物的药理学特性、放射性核素的选择、以及如何通过系统剂量学评估对目标和健康组织传递的辐射剂量。
此外,文章还探讨了放射性药物供应链的挑战,特别是对于治疗性放射性核素的需求增加,以及如何通过改进生产方法和确保可靠的商业供应链来应对这些挑战。文中提到了一些已获批准的放射性药物,包括用于治疗甲状腺癌、神经内分泌肿瘤和前列腺癌的药物。
文章还展望了放射性药物科学的未来发展,包括新型放射性核素的开发、新型载体分子的设计、以及人工智能在图像分析和剂量计算中的应用。作者提出了一系列建议,以促进放射性药物在肿瘤学中的发展,包括支持新型放射性核素的生产方法开发、建立在线数据库、加强国际和跨学科合作、开展更多临床试验等。
最后,文章强调了确保全球范围内放射性药物的获取和可用性的重要性,这将需要扩大生产能力、增加适合提供这些治疗的地点数量,并培训必要的科学家和临床医生。作者对放射性药物科学领域未来几年的发展充满期待,并相信这将为患者带来更好的治疗效果。
重点关注
放射性治疗诊断学(radiotheranostics)的应用过程涉及的两个主要步骤:
(A) 诊断成像:使用带有诊断性放射性核素(以黄色放射性标志表示)的肿瘤靶向载体(绿色六边形)获取成像扫描。这一步骤有助于:
- 患者筛选:确定适合接受放射性药物治疗的患者。
- 个体化剂量计算(individualised dosimetry):根据患者的具体情况计算适当的放射性药物剂量。
- 治疗监测:在治疗过程中监控疗效和可能的副作用。
(B) 放射性药物治疗:使用相同的靶向载体,但这次携带的是治疗性放射性核素(以红色放射性标志表示),来进行放射性药物治疗。
- 这一步骤利用了与诊断成像相同的靶向技术,但目的在于治疗,即向肿瘤组织传递放射性核素,以期达到消灭或控制肿瘤生长的效果。
这种诊断与治疗相结合的方法允许医生在治疗前精确地识别肿瘤位置,评估治疗剂量,并在治疗后监测治疗效果。通过使用相同的靶向载体,可以实现对肿瘤组织的精准照射,同时减少对周围健康组织的损害。这种方法在提高治疗效果的同时,也有助于降低副作用,是精准医疗的重要体现。
五、不宁腿综合征(Restless Legs Syndrome, RLS)的全基因组
关联研究(GWAS)的元分析
文献概述
这篇文章是一项关于不宁腿综合征(Restless Legs Syndrome, RLS)的
全基因组
关联研究(GWAS)的元分析。
研究团队对116,647名
具有欧洲血统的RLS患者和1,546,466名
对照组个体进行了基因组关联研究的元分析。这项研究的目的是提高对RLS的预测能力,寻找新的治疗方法,并深入理解其遗传结构和疾病生物学。
研究的主要发现包括:
- 确定了
164个
与RLS风险相关的基因位点,是之前已知数量的8倍。 - 发现性别特异性的遗传倾向性高度重叠(男性和女性之间的遗传相关性为0.96)。
- 通过基因集和细胞类型富集分析,强调了神经发育过程中的关键作用,特别是在胚胎和围产期大脑发育中。
- 通过药物基因组学分析,识别了13个潜在的药物靶点,包括谷氨酸受体亚单位,这为药物开发和再利用提供了新的方向。
- 利用机器学习方法结合遗传和非遗传信息,在风险预测方面表现最佳,其预测准确性(AUC)在0.82到0.91之间。
- 通过
遗传相关性
和孟德尔随机化分析
,发现RLS与多种疾病和特征存在显著相关性,包括与2型糖尿病的因果关系。
这项研究不仅为理解RLS的遗传基础提供了新的见解,而且为临床治疗和预防策略的改进铺平了道路。研究还指出了未来研究的方向,包括需要更大规模的纵向数据集和对非欧洲人群的遗传研究。
知识点补充:孟德尔随机化分析
孟德尔随机化分析(Mendelian randomization analysis,简称MR分析)是一种利用遗传变异作为工具来评估风险因素与疾病之间因果关系的统计方法。这种方法基于孟德尔遗传定律,特别是独立分配定律,该定律指出在形成配子时,不同基因座上的等位基因是随机组合的。
MR分析的基本思想是使用遗传变异(通常是单核苷酸多态性,即SNPs)作为潜在风险因素的代理,来探索它们与特定疾病或表型的关联。如果一个遗传变异与某个风险因素相关,并且这个变异也与疾病有关联,那么可以推断这个风险因素可能对疾病有因果影响。
MR分析的关键步骤包括:
- 选择工具变量:这些是与感兴趣的风险因素相关,但与疾病直接关联的遗传变异。
- 评估关联性:检查这些工具变量是否与风险因素有统计学上的显著关联。
- 评估因果效应:使用工具变量来估计风险因素对疾病的影响,这通常通过回归分析完成。
MR分析的优势在于:
- 减少混杂因素:由于遗传变异在生命早期就已经确定,因此它们不太可能受到生活方式或其他环境因素的影响,这有助于减少混杂偏倚。
- 提供时间顺序:遗传变异在个体出生前就已经存在,因此可以提供风险因素和疾病之间的时间顺序信息,有助于确定因果关系。
- 利用现有的遗传数据:可以利用现有的全基因组关联研究(GWAS)数据进行MR分析。
然而,MR分析也有局限性,包括:
- 违反工具变量的假设:如果遗传变异同时影响风险因素和疾病,但不是通过风险因素影响疾病,那么MR分析可能会得出错误的结论。
- 样本量限制:MR分析可能需要大样本量来检测遗传变异与疾病之间的小效应。
- 多效性问题:如果遗传变异通过多种生物学途径影响疾病,那么MR分析可能难以准确估计风险因素的直接效应。
在上文提到的研究中,MR分析被用来探索RLS与糖尿病等其他疾病或特征之间的潜在因果关系。
观点讨论:遗传性在肿瘤疾病中的影响
遗传性在肿瘤疾病中的影响是一个复杂而多维的领域,涉及多种遗传变异和机制。
-
遗传易感性:某些遗传变异可以增加个体发展特定类型肿瘤的风险。这些变异可能存在于肿瘤抑制基因或癌基因中,它们可能影响细胞周期、DNA修复机制、细胞死亡(凋亡)和血管生成等过程。
-
家族性癌症:在某些情况下,家族中多个成员患有同一种癌症,这可能是由于遗传了特定的突变。例如,BRCA1和BRCA2基因的突变与遗传性乳腺癌和卵巢癌的风险增加有关。
-
遗传综合征:某些遗传综合征,如遗传性非息肉性结直肠癌(Lynch综合征)、多发性内分泌腺瘤病(MEN1)和von Hippel-Lindau综合征,与特定类型的肿瘤发展风险增加有关。
-
基因-环境交互作用:遗传易感性与环境因素(如烟草烟雾、紫外线照射、化学物质暴露)的交互作用可能共同影响肿瘤的发生。
-
基因组不稳定性:遗传变异可能影响细胞维持基因组稳定性的能力,导致DNA复制错误和染色体异常,这些变化可以促进肿瘤的发展。
-
表观遗传学:除了DNA序列的变化,遗传性还可以通过表观遗传机制影响肿瘤发展,包括
DNA甲基化
、组蛋白修饰和非编码RNA的表达。 -
肿瘤微环境:遗传变异可能影响肿瘤微环境中的细胞和分子,包括免疫细胞、基质细胞和细胞外基质,这些因素共同影响肿瘤的生长和转移。
-
治疗反应:遗传变异也可能影响个体对特定癌症治疗的反应,包括化疗、放疗和靶向治疗。
-
预防和筛查:了解遗传性在肿瘤疾病中的作用可以帮助开发预防策略和筛查程序,特别是对于高风险群体。
-
个性化医疗:基于遗传信息的个性化医疗可以帮助医生为患者选择最合适的治疗方案。
遗传性在肿瘤疾病中的作用是一个活跃的研究领域,随着基因组学和精准医疗的发展,我们对遗传性如何影响肿瘤发生、发展和治疗的理解将不断深入。
重点关注
图1展示了通过途径富集分析得到的显著富集的生物学途径。
分析使用了两种不同的方法:DEPICT和MAGMA,并且基于它们的语义相似性对GO(基因本体)术语进行了聚类。
这些术语被表示为矩形,并根据它们所属的聚类进行着色,每个聚类由粗边框线标识。每个矩形的大小代表了富集的显著性,即矩形越大,表示该术语在该途径中的富集程度越高。
具体来说:
- a部分:使用了DEPICT方法的结果显示了基因集富集分析的结果。
- b部分:使用了MAGMA方法的结果显示了基因集富集分析的结果。
在两种方法中,最显著富集的术语(即P值最小的术语)被选为每个聚类的代表性术语,并以白色字体显示。这样的表示方法允许研究者快速识别哪些途径在RLS的遗传结构中起着重要作用。
通过这种分析,研究者能够识别与RLS相关的生物学过程和功能,这对于理解疾病机制和发现潜在的治疗靶点至关重要。然而,具体的生物学途径和它们的生物学意义需要结合详细的生物学背景知识来解释。
六、在肿瘤学领域实现公平的人工智能
文献概述
这篇文章名为《Towards equitable AI in oncology》,发表在《Nature Reviews Clinical Oncology》。
文章讨论了人工智能(AI)在临床肿瘤学中应用的潜力,尤其是在早期癌症检测
、风险评估
和个性化治疗建议
方面的潜力。然而,文章指出AI的好处在地理和特定人群中分布不均,强调了开发公平AI工具的必要性,这些工具在不同患者群体中都应准确且易于获取,包括那些生活在中低收入
国家(LMICs)的患者。
文章探讨了实现公平AI的挑战和潜在解决方案,包括解决现有临床数据集中不同人群代表性不足的问题,以及使用不充分的临床验证方法。文章还关注了现有的不平等来源,包括模型方法的选择(如深度学习和基于特征工程的方法)、数据集策划策略的含义、在不同人群和环境中进行严格验证的必要性,以及在高收入国家主要开发工具时引入的上下文偏见风险。
文章提出了一些建议,以帮助解决AI中的不平等问题,包括全球数据联盟和新技术如合成数据的成功案例,并建议AI开发者、肿瘤学家和监管机构等关键利益相关者采取特定行动。文章最后讨论了在AI模型开发中优化公平性的机会,并提出了一个逐步优化AI模型开发公平性的图示。
重点关注
图1展示了在人工智能(AI)模型开发的所有阶段中优化公平性的机会,并以逐步的方式进行了强调。
以下是对图1内容的分析:
-
初始概念化和设计:从一开始,就应该考虑公平性,设计特征以确保包容性,减少AI训练中的偏见。
-
数据收集和注释:优先考虑多样化的数据集,包括代表性不足的群体,以减少偏见。数据应该基于疾病生物学,整合减少偏见的策略。
-
特征工程和模型开发:使用特征工程方法,选择预定的成像特征,以提高AI算法在医学图像上的性能,使领域专家能够更准确地预测结果。
-
模型验证和测试:使用多样化的数据集进行验证,确保模型在不同人群中表现公平和准确。
-
监管审批:在监管审查过程中解决算法偏见问题,倡导公平性,确保设备能够公平地获得批准。
-
部署和监控:在部署过程中解决偏见问题,确保公平的结果,并在每次迭代中优化公平性。
-
持续改进和迭代:持续监控和改进AI模型,以确保其在不同患者群体中的公平性和有效性。
这个图强调了在AI模型开发的每个阶段都需要考虑公平性,从数据收集到模型设计,再到验证、监管审批、部署和持续改进。通过这种全面的方法,可以提高AI工具在不同患者群体中的适用性和效果,特别是对于历史上服务不足的社区和中低收入国家的患者。