【论文阅读】-- Color Coding of Large Value Ranges Applied to Meteorological Data（应用于气象数据的大值范围彩色编码）

本文链接：https://blog.csdn.net/weixin_46112690/article/details/139682469

在这里插入图片描述

应用于气象数据的大值范围彩色编码

在这里插入图片描述

摘要

本文提出了一种全新的色彩方案，旨在解决在数据序列具有大范围值时的可视化难题，因为在这种情况下，尺度变换提供的帮助有限。我们特别关注气象数据，其中出现大范围值的情况很常见。我们将这一方法应用于气象散点图，这是该领域中最常用的图表之一。我们的方法利用数值的尾数和指数的数字表示来指导设计出新颖的“嵌套”色彩方案，能够突出不同量级之间的差异。我们通过用户研究评估了新设计、最新的色彩尺度以及在气象数据分析中代表性的色彩方案：ColorCrafter、Viridis和彩虹色谱。我们从判别（比较）和解释（读取）任务的角度评估了准确性、时间和信心度。我们提议的色彩方案在解释任务上显著超越了其他方案，同时在判别任务上的表现与它们相当。

关键词：颜色编码—感知—大值范围用户研究

1 引言

具有大值范围的数据是指其值包含使用科学记数法(v = m·10e) 的多个不同指数的数据集[8]。一个例子是云中冰水含量的气象数据，其指数在负八到负二之间变化。数据包括三个变量：时间、高度和冰水含量。在 2D 可视化中不可能将值映射到位置。当前的气象标准是使用散点图来可视化数据，其值由对数缩放颜色图编码 [5, 9]。气象学家将此称为时间高度序列。面临的挑战是在色标和有限数量的像素上编码如此大的值范围而不丢失信息。

用于气象散点图的常见颜色图是 Viridis（图 1a）[5] 和 Rainbow（图 1b）[9]。我们提出了一种新颖的颜色方案来可视化具有大值范围的数据：数量级颜色（OMC），它使用数据的尾数和指数的单独表示（图1d），以便更容易地对数量级进行分类。它对每个指数使用一种色调，对幅度内的亮度使用线性梯度。此外还显示了该设计的一个变体（图 1e）。

我们在实证用户研究中将我们的方法与当前使用的色标以及通过工具 ColorCrafter [20]（起始颜色：蓝色）（图 1c）生成的最先进的配色方案进行比较。结果表明，我们的新配色方案在比较任务中具有可比较的结果，并且在读取值方面比其他配色方案效果明显更好。我们已经收到气象学家要求使用我们的设计的请求。

2 相关工作

颜色感知 Golebiowska 和 Coltekin [6] 探索了从彩虹到连续色阶的感知差异。他们的研究表明，顺序颜色图在比较值和识别一般模式方面表现更好，而彩虹标尺则支持读取特定细节。我们还针对所研究的任务比较了这两种类型的配色方案。

彩虹配色方案的优缺点已在文献中广泛讨论。 Rogowitz 和 Treinish [17] 批评彩虹颜色图，因为不同颜色的边界可以被视为数据中的边界。 Reda 和 Szafir [16] 以及 Reda 等人的研究结果反驳了这一点。 [15]表示的颜色越独特，情节就越好。

有多种工具可用于生成和优化色阶。 ColorCrafter-tool [20]为给定参数创建算法生成的顺序配色方案。这些颜色图适用于最定量的数据，但在可视化具有较大值范围的数据时会隐藏细节。另一个软件是 CCC 工具，它允许创建全新的配色方案并优化给定的色标 [12]。

基于统计特性 [19, 21] 的配色方案的数据依赖性调整将导致每日视图的不可比性。因此，我们忽视他们。

大值范围的可视化 大多数关于大值范围的研究工作都引入了二维数据的新颖可视化类型。 Hlawatsch 等人提出的条形图方法。 [7]，博尔戈等人。 [2] 和Ḧohn等人。 [8] 不适用于我们的用例。它们为我们的工作提供了灵感——指数和尾数的单独表示。

任务分类 大多数任务类型可以分为高级任务和低级任务 [3]。有几篇论文处理低级任务并介绍了自己的任务分类法 [1,13,18,22]。在我们的用户研究中，我们使用所有分类中出现的两个低级任务来评估色标。

3 配色方案设计

我们提出了一种新颖的配色方案，称为数量级颜色（图 2）。该设计的灵感来自于数字的科学记数法，并在 CCC 工具中创建[12]。受最近方法 [2,7,8] 的启发，我们使用值 v 的尾数 m 和指数 e 两部分（以便 v = m·10e）进行颜色编码。数据中给出的每个指数都映射到另一种色调。在指数内，尾数被映射到相应色调的感知线性顺序尺度。

在这里插入图片描述
在研究过程中，我们针对气象数据创建并尝试了许多不同的色标（参见补充材料）。与气象学家一起组织的几个焦点小组讨论并商定了颜色选择以及数据和研究任务。在最终的设计中，颜色是通过手动过程选择的，以便相邻颜色之间的颜色距离大致均匀。色盲将是进一步研究的附加标准。我们使不同色调的 HSV 梯度尽可能平滑且相等（见图 2）。为了获得更好的颜色可命名性 [15, 16]，我们选择了独特的色调，而不是一种特定色调的不同饱和度色调。

颜色的边界很容易被视为数据中指数的变化[17]。这被认为是合适的，因为我们的颜色图描述了幅度的变化。它可以帮助气象学家查看数据的变化。尽管如此，我们还创建了 OMC 颜色图的变体，以减少颜色距离（即较小的 DeltaE 值 [11]）（见图 2 和图 3）。在此版本中，我们每隔一个顺序色标翻转一次，以便比较两个相邻色标时亮度方向发生变化：OMC 平滑亮度（图 3）。

在这里插入图片描述

4 评价

Viridis 和 Rainbow 是用于可视化气象数据的常见配色方案。因此，我们在探索性用户研究中评估了这两个，由 ColorCrafter [20] 创建的最先进的色彩图以及我们的两个新设计 - OMC 和 OMCsl。

数据研究使用的数据是科隆大学地球物理与气象研究所提供的真实气象数据集。每组数据包含一个测量日，变量为时间（0至24小时）、高度（0至12公里）和云中的冰水含量。冰水含量范围为 $10^{−8}$ 至 $10^{−2}$ 。由于值范围较大，颜色图按对数缩放。

为了避免学习效应，研究的每个问题都包含不同测量数据的可视化。为了保持一致性，我们使用具有相似属性的数据集，例如相等的值范围。

任务根据文献并与气象学家协商后，我们决定重点关注四个主要任务，分为阅读[1,3,13,18,22]和比较[3,13,18,22]任务：

读取任务：
- 极值：指定给定日期的最大和最小指数
- 值：指定数据点标记区域的值范围
比较任务：
- 极值：比较两个测量日，确定哪一个包含全局极值
- 值：比较一天内两个标记区域的数据点的值

我们手动选择区域以确保每个颜色图的任务具有相同的难度级别。比较题为单选题、多选题。在阅读任务中，参与者必须手动插入他们回答的数字。此外，我们还询问了参与者对阅读任务给出的答案的信心。

实验设置和程序 共有 53 名参与者（36 名男性、13 名女性和 4 名不愿意透露的人）参与了这项研究。年龄分布在20岁至60岁之间，但大多数参与者在20岁至40岁之间（88%）。我们筛选出了 5 名未正确回答石原色盲测试的参与者 [4]（这是必要的，因为彩虹量表不适合色盲）。

参与者的专业知识很广泛，从数学学位 (25%) 到物理学学位 (13%)、计算机科学学位 (10%) 和其他学位 (4%)，大多数参与者拥有气象学学位（48%）。

该研究是通过 LimeSurvey 在线进行的 [10]。每页有一个任务，参与者必须手动单击按钮才能进入下一页，因此我们可以存储给定的答案和每个任务的响应时间。使用的可视化效果的分辨率为 1291x500 像素。所有参与者都使用尺寸至少为 13 英寸的电脑屏幕。

研究的处理时间约为 30 分钟。所有参与者都必须解决相同的任务。每种类型的任务的五种设计中的每一种都有一个任务，即我们总共有 5[色阶] × 4[任务] = 20 次试验。

在介绍可视化类型和任务类型的简短训练阶段后，任务的排序是随机的，以降低学习效果。研究结束时，参与者被要求提供反馈。研究文件见附件。

4.1 分析

结果分析在 R [14] 中进行。对于研究的每项任务，我们都会测量准确性和响应时间。在阅读任务中，还会检查参与者的指定信心（李克特量表，从 1 - 非常不确定到 5 - 非常自信）。

正确性测量 对于每项任务，我们都会将正确答案的数量与错误答案的数量进行比较。在极值读取任务中，两个指数都必须正确才能被视为正确答案。对于值读取，如果标记区域的值位于答案范围内，则答案是正确的。

此外，还比较读取值任务中指定范围的大小。为了排除对数缩放，使用公式 1 计算范围的大小：

$\text{range size}=\frac{(Exp_{max}-Exp_{min})\cdot10+(Mant_{max}-Mant_{min})}{10}\qquad\text{(1)}$

显着性检验 为了进行我们的分析，对每项任务使用了三阶段显着性检验。由于我们不能假设数据呈正态分布，因此我们首先对给定的答案和响应时间进行 Shapiro-Wilk 测试，结果没有数据呈正态分布。

在分析的第二阶段，我们使用χ2检验（如果频率太低则使用 Fisher 检验）来研究正确和错误答案数量的显着性。对于范围大小或响应时间等定量数据，我们使用了 Kruskal-Wallis 检验。

在第三阶段，作为事后分析，我们分别使用 Wilcoxon 检验和 χ2 检验来对发现显着性的任务的配色方案进行成对比较。

所有检验均以显着性水平 α = 0.05 进行。

4.2 结果

图 4 显示了结果摘要，包括四个任务中不同颜色图的正确答案百分比以及参与者的响应时间。
在这里插入图片描述
阅读极值 我们的 OMC 设计（正确答案为 71%）和彩虹配色方案（69%）表现最佳。 χ2 检验显示色标与正确/错误答案数量之间存在显着依赖性（χ2 = 52.466，p 值 = 1.102e−10）。事后配对测试证实，OMC 和 Rainbow 的结果明显优于 ColorCrafter (33%) 和 Viridis (10%)（表 1）。 OMCsl 排名第三，正确答案率为 60%。

在这里插入图片描述
阅读值 OMC 设计在正确答案的数量方面表现最佳。 χ2 检验表明显着性（χ2 = 19.833，p 值 = 0.001）。由于成对测试，只有 Viridis 颜色图明显比其他颜色方案差。

在给定范围大小的比较中可以更好地看到 OMC 颜色图的积极效果（图 5）。 OMC 颜色图具有迄今为止最小的范围大小（平均值 = 0.36），其次是 OMCsl (0.68)。 Viridis (0.91)、ColorCrafter (0.99) 和 Rainbow (1.15) 处于相似水平。 Kruskal-Wallis 检验证实了平均值的显着差异 (χ2 = 50.518，p 值 = 2.814e−10)。成对 Wilcoxon 检验表明，OMC 色标比所有其他色标导致显着更小的范围大小（即更好地识别搜索值）（表 2）。 OMCsl 的性能也明显优于 ColorCrafter 和 Rainbow。这可以归因于我们的设计方法，不同的色调可以快速识别震级。

在这里插入图片描述
极值比较 犯的错误很少。 ColorCrafter（3 个错误）和 OMCsl (3) 的错误最多，其次是 Rainbow (2) 和 OMC (1)。 Viridis 甚至没有产生任何错误。由于错误数量较少，使用 Fisher 精确检验无法确定显着的相关性（p 值 = 0.471）。

值比较 ColorCrafter 在该任务中表现最差（正确答案为 58%）。 OMCsl 的正确率高达 94%，而其他三个甚至有 98%。由于 χ2 检验，存在显着影响（χ2 = 66.679，p 值 = 1.332e−9）。事后配对 Fisher 检验表明，ColorCrafter 导致的错误明显多于所有其他色标（表 3）。
在这里插入图片描述

4.3 扩展分析和结果

置信度 对于阅读极值任务，对参与者置信度的分析表明，顺序配色方案（Viridis、ColorCrafter）比多色方案（OMC、OMCsl、Rainbow）导致答案的不确定性显着增加。
对于读取值任务，参与者对我们的 OMC 色标比其他所有色标更有信心，无论是对于指定范围的指数还是尾数。

时间仅对于值比较任务，Kruskal-Wallistest 显示响应时间的显着平均效果 (χ2 = 13.398，p 值 = 0.009)。正如成对 Wilcoxon 测试所示，参与者在 ColorCrafter 上花费的时间明显多于其他人。值得注意的是，参与者不需要任何额外的时间来理解我们新的数量级颜色设计。

免费文本 31 位参与者提供了免费文本反馈。几乎所有人都对我们的 OMC 色标持积极态度。我们已经收到了使用我们的设计的请求。据称，该配色方案通过其清晰的边界支持数值比较和识别：“10的每一次方之间具有不同颜色的色标使我能够更好地识别数值和点之间的差异。”改进建议是颜色选择和定性图案的感知。
顺序色彩图被认为更美观。 Rainbow 和 ColorCrafter 得到的负面反馈最多，尤其是它们的颜色渐变。

专业知识 将具有气象背景的参与者的结果与其他参与者的结果进行比较，他们的答案正确性和响应时间没有显着差异。这表明我们的配色方案可以广泛使用，无需特定的专业知识或背景。

限制我们的配色方案存在一些限制。该方法不适合比较接近指数边界的值或包含正值和负值的数据。此外，可能需要进一步的实验来评估所提出的方案对于不同指数分布的值范围的可扩展性。为了不使用户研究过于广泛，我们专注于与我们的合作者最相关的任务子集。因此，某些类型的任务无法得到充分处理。例如，对高级任务的 OMC 颜色图进行评估会很有趣。

5 结论和未来工作

我们提出了一种新的颜色编码方法，用于可视化具有大值范围的数据并应用于气象数据。实证研究表明，我们的数量级颜色设计对于所有检查的任务都表现得非常好。它与比较任务中表现最好的颜色图没有显着差异，并且显着提高了值识别的准确性。我们的配色方案的严格边界支持不同数量级的感知。

总之，我们的结果对每个提议的设计提出了以下排名：

读取极值： $\mathbf{OMC}\succeq\text{Rainbow}\succeq\text{OMC}_{sl}\succ\text{Color}\text{Crafter}\succ\text{Viridis}$
读取值： $\mathbf{OMC}\succ\mathrm{OMC}_{sl}\succeq\mathrm{Viridis}\succeq\mathrm{ColorCrafter}\succeq\mathrm{Rainbow}$
极值比较： $\mathrm{Viridis}\succeq\mathbf{OMC}\succeq\mathrm{Rainbow}\succeq\mathrm{OMC}_{sl}\sim\mathrm{ColorCrafter}$
值比较： $\mathbf{OMC}\sim\text{Viridis}\sim\text{Rainbow}\succeq\mathrm{OMC}_{sl}\succ\text{Color}\mathrm{Crafter}$

总的来说，我们的研究结果证实了 Golebiowska 和 Coltekin [6] 的发现，即 OMC 和 Rainbow 等多色量表更适合阅读任务，而 Viridis 等顺序量表更适合比较任务。

我们的设计是基于多维气象云数据的应用实例而开发的。我们的评估与数据无关，这使得我们的结果可以扩展到其他数据集。然而，颜色方案的选择是通过我们与领域专家的合作得出的，因此，在未来，我们希望在来自不同应用领域的其他数据类型上测试我们的方法的性能，并可能探索新的颜色方案。此外，我们必须研究新设计的色盲问题。