本文将以重症监护医学领域的应用为例,讲述如何使用DarwinML来辅助医疗研究者。功能包括以页面拖拽方式自动抽取数据特征,并根据实际研究需要,调整入模特征、数据清洗方案、模型拟合方向等,使用平台可反复生成并比较模型,最终完成研究目标。
为了帮助研究者专注于领域内积累,考虑到医疗研究者同时面临临床医疗和病理研究等多方压力,在使用DarwinML过程中,我们全程支持点击拖拽,中间结果可视可下载,研究者只需重点关注原始数据输入和评估结果输出。
DarwinML DataFusion数据抽取平台
该平台帮助研究者将原始数据自动转换为可以被模型使用的特征数据,功能通过数据流形式实现,研究者可以通过修改参数和拖拽节点灵活改变特征抽取过程。下图是一个数据流示意图。
DarwinML Studio自动建模平台
从数据导入和清洗为起点,DarwinML可自动建模并给出模型多方位评估结果,研究者只需要重点关注模型评估结果。研究者根据研究目标,自行返回去调整最初的数据清洗方案和模型设置,多次建模,选择符合研究需要的最终模型。
DarwinML自动建模平台全流程如下:
1)数据清洗:均衡样本分布&