本文是LLM系列文章,针对《Exploring Multilingual Large Language Models for Enhanced TNM classification of Radiology Report in lung cancer staging》的翻译。
摘要
背景:由于劳动密集型的结构化和叙事式报告,结构化放射学报告仍然不发达。深度学习,特别是像GPT-3.5这样的大型语言模型(LLM),为用自然语言自动构建放射学报告提供了希望。然而,尽管有报道称LLM在英语以外的语言中效果较差,但它们的放射学性能尚未得到广泛研究。
目的:本研究旨在调查基于使用GPT3.5 turbo(GPT3.5)的放射学报告的TNM分类的准确性,以及日语和英语多语言LLM的实用性。
材料和方法:利用GPT3.5,我们开发了一个从癌症胸部CT报告中自动生成TNM分类并评估其性能的系统。我们使用广义线性混合模型统计分析了在两种语言中提供完整或部分TNM定义的影响。
结果:完整的TNM定义和英文放射学报告达到了最高的准确性(M=94%,N=80%,T=47%,ALL=36%)。为T、N和M