介绍
分析化学或生物医学中的 Bland-Altman 图(差异图)是一种数据绘图方法,用于分析两种不同测定之间的一致性。它与Tukey 均值差图相同。
应用场景
一组数据为 “ground-truth”,即 “金标准”,如睡眠分期中的PSG、行为分类中的label;
另一组数据为“ground-truth”,即使用机器学习算法得到的分类结果。
这种自动化的方法到底好不好?能不能代替专家来分析数据?就需要对这种自动化方法得出的结果进行评估。
一致性分析
用两种方法对同一组数据进行测量,一般不会获得完全相同的结果,总是存在着一定趋势的差异,如一种方法的测量结果经常大于(小于)另一种方法的结果,这种差异被称为偏倚。
这种偏倚可以用两种方法测量结果差值的 均值 进行估计,均值 的变异情况可以用差值的 标准差 来描述。如果两种方法结果的差值服从正态分布,则95%的差值应该在 之间。
我们称该区间为 95%一致性界限(95% limits of agreement,95% LoA),当绝大多数差值位于该区间内,则可以认为这两种方法具有较好的一致性,可以互相代替(更严格说还要考察这个范围在专业上是否被认可为一致的)。
Bland-Altman图
Bland-Altman 图是反映数据一致性很简单直观的图示方法。Bland-Altman 方法的基本思想是计算两组测量结果的一致性界限,并用图像直观反应这个一致性界限。
在 Bland-Altman 图中,横轴表示两种方法测量每个样本的结果均值,纵轴表示两种方法测量结果的差值。
图中上下两条 红色水平虚线 表示 95%一致性界限的上下限,即 1.96 倍的标准差;中间的 蓝色水平实线 代表差值的均值;橘黄色水平虚线 表示差值平均值为 0 的位置。
两种方法测量结果的一致程度越高,代表差值平均数的线(蓝色实线)就越接近代表差值平均数为 0 的线(橘黄色虚线)。
根据 95% 一致性界限外侧的数据点个数和一致性界限内的最大差值,以及临床上的可接受程度,可对自动化分割方法做出一致性评价。
画图
Plotly Python Graphing Libraryhttps://plotly.com/python/
课题研究
参考睡眠分期validation的论文,对PSG得到的睡眠参数进行分析