原文链接:https://www.scientificamerican.com/article/how-to-get-better-at-embracing-unknowns/
简述
- 数据可视化可以使信息的不确定性更加清晰,但不能很好表达的话会使信息的不确定性更加混乱。
- 例如,即使图表里的误差线(error bar)看起来很准确,但是经常会有人错误理解。
- 分位数点图可能是有效的,因为它们将不确定性呈现为人们可以直观看到的离散概率。
- 有效的不确定性可视化可以帮助我们从分析和直觉上对于未来事件可能性做出判断。
正文
在追踪飓风的时候,天气预报人员通常会展示一张描绘“不确定性锥体”的地图。它以飓风当前的位置为起始点,逐渐扩大覆盖范围到飓风在接下来几天可能会穿越的一片区域。锥体中心线是飓风路径的概率最高,从中心线向锥体边缘部分飓风经过的概率逐渐下降。问题是,很多人误以为锥体是未来风暴的大小。
调查发现,如果预报人员直接展示一些飓风可能经过的路径,误解会被避免。但是这种方法也会产生误解:很多人会认为每条路径穿过的地区受损可能性会更大,而路径之间的地区受损可能性相比较会小。
不确定性普遍存在于科学家和各种组织用于为决策提供信息的数据中。信息的视觉描述有助于明确不确定性,或者不明确。理想状态下,可视化帮助我们从逻辑上和情感上对于不同结果的概率做出判断。然而,大量关于人类推理的证据表明,当人们被要求做出包含概率的判断时,他们往往会忽视不确定性。随着社会越来越以来数据,图形设计师们正在努力解决如何最好地表现出不确定性的问题。
接下来是展示不确定性的可视化技术的一些例子,大致从不那么有效到比较有效的顺序来列举。了解如何选择和实现不同的方法可以帮助我们更好地理解数据和所涉及的不确定性。
无量化方法
描述不确定性最无效的方法就是根本不表示它。有时候数据设计者试图通过选择一种方法来暗示有一定程度的不精确并且没有对其进行量化,从而弥补缺少详细说明的不确定性。例如,一个设计者可能会将数据映射到人们难以定义的视觉变量上,像飘在空间中的圆,而不是有x轴和y轴的图上的点。这种方法使得读者的理解更容易出错。或者设计者可以用程序创建手绘或“草稿”风格的图形。这两种方法都有风险。
区间
区间可能是最常用来表示量化的不确定性的方法。误差线和置信度 envelope 被广泛使用。但即使他们看起来准确、直观,仍然很难被正确理解。研究显示,科学家们也经常被误解它们。
概率密度图
设计者可以将不确定性直接转换为可视化的视觉特征。例如,梯度图可以从中心的深色(高概率)过渡到边缘处的浅色(低概率)。在提琴图中,更宽的点意味着更高的概率。将概率密度映射到视觉变量的方法比间隔方法更详细地表示不确定性。但是其有效性取决于读者能否分辨阴影、高度或其他视觉特征的变化。
图标阵列
将30%的概率转变为“10个中的3个”可以让人们更容易理解不确定性,并因此适当地使用这些信息。人们可能更好地理解离散概率,因为他们经常在日常中遇到。
空间的多个样本
时间上的多个样本
混合方法
https://projects.ncsu.edu/labwrite/res/gt/gt-stat-home.html#opennewwindow