使用Python简化临床对话
作者:Nimshi Venkat 和 Sandeep Konam,Abridge
在 Abridge,我们的使命是为每一次医疗对话带来背景和理解,以便人们能够掌握自己的健康。我们利用突破性的机器学习(ML)研究帮助人们专注于他们健康对话中最重要的细节。Python 是 Abridge 机器学习生命周期的主要驱动力,包括数据注释、研究与实验,以及将机器学习模型部署到生产环境。
我们的移动应用程序截图展示了我们的临床概念提取模块(以粗体字显示)和一个计划分类器(作为 Abridge Moment)。这两者都是部分由 Python 驱动的。
机器学习
对话建模、自然语言理解、信息提取和总结是我们在 Abridge 追求的一些活跃研究领域。我们的研究由最大的真实、去标识化且完全同意的健康对话语料库之一支持。我们与临床医生和研究人员合作制定了指南和模板,精心注释了数据。Google Sheets 的 Python API 使我们能够扩展注释模板的创建,适当地将文件分配给注释者,并有效地管理质量控制流程——所有这些操作都无需构建任何新的网络或移动应用程序。
Jupyter Notebook 是 IPython 项目的一个衍生项目,它允许我们在集成环境中清理数据、构建和训练机器学习模型,并评估模型的性能。例如,我们使用 Jupyter 构建、测试和可视化了我们最近发表的一些工作中的特色模型——包括一个可以从医疗对话中自动提取药物、剂量和频率的药物方案提取流水线,以及一个可以提高通用自动语音识别(ASR)系统转录质量的 ASR 校正系统。
我们