情境认知测量方法的研究

最新推荐文章于 2023-09-08 09:40:05 发布

人机与认知实验室

最新推荐文章于 2023-09-08 09:40:05 发布

阅读量5.5k

点赞数 1

本文探讨了情境认知的测量方法，包括主观和客观两种途径。主观测量侧重于操作者的自我评估和观察者的评估，而客观测量则关注操作绩效、生理指标等。文章还对比了情境认知的定性分析模型与定量评价模型，旨在为情境认知的研究提供全面的方法论指导。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

近年来，虽然越来越多的学者研究了作为过程与结果的情境认知的差别，但大多数学者仍把注意力集中在对情境认知结果的测量上，即对特定时刻特定范围内情境认知的测量上，这样以来（如Andre在1998年对情境认知结果的研究）就回避了这样一个重要问题，即信息是怎样获取的以及工作负荷对信息处理过程影响的大小如何。然而，为了实现对情境认知的预测或理解操作人员是怎样形成情境认知的，就有必要考虑信息获取的行为过程及利用处理的信息资源进行决策、采取行动的过程。因此，对于具体情境认知研究来说，应该强调的是：一定要提出操作人员是怎样获得情境认知的，并且在多大的工作负荷条件下操作人员能够最大限度地获得并使用他们的情境认知的？对于确定情境认知的训练方法来说，这个问题非常重要，如果忽略了操作人员（如飞行员）是怎样获得情境认知的及工作负荷对它的影响，那么情境认知的训练就无从谈起。

为实现情境认知的测量，既需要考虑其发展的过程又需要考虑其最终的结果，具体要求如下：

（1）情境认知的外显/内隐成分（结果）；

（2）最佳的信息获取行为（过程）；

（3）资源配置策略（能力）；

（4）工作负荷条件（约束）。

上述各项的测量对实现实用的情境认知训练具有重要的作用，并且这种测量安排是能够将情境认知从心理概念转变为可操作的实用工具的。

下面我们将先根据上述要求对情境认知的测量方法进行分析和总结，并提出我们的测量方法，然后结合上一章的研究对情境认知定性模型和定量模型作一下比较，最后确定我们建立的情境认知实验及模糊综合评判模型（详细见第四章的实验设计及第五章的模糊综合评判研究）。

1.1 情境认知测量方法的研究

情境认知是人机交互领域迫切需要测量的一个最普遍但又很模糊的概念。Tenney等于1992年提出“认知处理过程应包括在情境认知的获得及保持过程中”，这就非常接近我们的最终研究目标：实现对操作者（如飞行员、控制者）将来操作行为的预测评价并开发出相当的实时自动辅助系统以增强操作者的情境认知和操作绩效。如果要实现对情境认知的评价进而准确地预测出操作者在复杂任务环境中的操作特性，那么有效的测量方法就是必须的。目前，对情境认知的测量包括主观和客观两种方法，这两种方法既可以是实时进行的，也可以是非实时进行的。

1.1.1 情境认知的主观测量法

1、情境认知主观测量法的影响因素

在过去的20多年中，对情境认知的测量评估已有许多不同的方法。其中大多数方法都是想通过主观方法直接地测量评估情境认知，对情境认知的过程及操作特征指标的测量方法研究较少。对于直接测量评估情境认知来说，到目前为止，主观方法（调查表, 问卷）最为普遍。由于该方法的简便易行，所以很受欢迎。其主要测量影响因素主要有以下四个方面：

（1）由谁评估？操作者还是观察者

由于操作者本人很少知道自己情境认知的缺陷，所以Endsley认为操作者自评方法测量的主要是操作者本人确信的感觉，而不是真正的情境认知状况。

观察者评估是指有关评价主题的专家或有一定知识的观察者使用精确的准则来评估操作者的情境认知。McMillan 在1994年对战斗机飞行员技能的研究中（情境认知作为一个独立的研究变量），由200多个专家和其他观察者共同制定了一个情境认知调查表，并且两者的评估结果非常相近，但是有潜在的缺陷：观察者不能了解到操作者内在的情境认知究竟是什么；操作者为处理某个事件会不管哪个变量；基于获得的变量，操作者进行了怎样的信息处理。当然，与其他情境认知的测量方法一样，这种方法也存在着许多不确定因素的制约。

（2）测量什么？操作者情境认知的感知，操作者当前的认识/记忆，还是要求资源的评估？

毫无疑问，不同的主观测量表的目的是测量不同的事情。一些是要求操作者（或观察者）对情境认知的直接说明，这种方法有时不切实际地假设操作者没认出他们没有感知到的事物，并因此只能提供一个他们觉察出的情境认知，这明显和实际的情境认知不符；另有一些是测试操作者对特定条件或状况下的记忆（觉知）；最后，有些表不仅是对情境认知结果的测量，而且还包括获得结果的要求资源的测量。

（3）测量应用在何处？是作为事件的一个绝对的指标还是作为相对指标？

绝对（或直接）评估要求操作者在某一特定时刻确定一个自己情境认知的数值（如在进入一个信息密集区时），此时，假定评估在该事件过程中与情境认知的绝对幅度有关（如整个的飞行阶段，要求飞行员果断地回答同意或是不同意）。相对（间接）评估要求操作者比较自己在不同事件过程中确定的情境认知的数值。或通过多个操作者再进行比较。

（4）什么时候测量？试验过程中还是试验之后？

试后（回顾）调查表是指在试验完成后实施的调查，常常包括参加者的回忆：什么类型的目标出现，有多少个？它们在何处。通过要求参加者对完成某项任务决策的一系列问题的事后询问，来实现对广义合理化行为、结果偏差的回忆、驱动行为的回忆、遗忘、近因作用的调查。Sarter 和 Woods认为，后效情境认知的数据采集是以内在的上下文相关的驱动，因此很可能产生失真。

实时问卷调查，即在操作者执行任务时进行的调查（如飞模拟器控制飞行空域），可以克服许多试后（回顾）调查表带来的问题。实时的记忆测试可以在特定事件发生时获得数据，进而克服了时间延迟（在事件发生到回忆之间）问题。情境认知可被看作是飞行员出错的函数。飞行员可以分神或被打断以实时地回答（通过飞行自动驾驶等方法）问卷调查问题。也可以采用口头协议的形式，如飞行员被要求一边操作一边自言自语，但这种方式很可能改变执行任务的方式。Pew1995年提出，实时口头协议的情境认知评估方法在其发展的早期（感知阶段）非常有用，随后有可能干扰综合理解、预测规划阶段的正常进行。

另一个实时问卷调查的方法是“冻结”。模拟器可以随机地在任何时刻被冻结/停止，所有的显示一片空白，然后询问飞行员当时的情境认知状况问题，情境认知可被看作是飞行员对问题反应出错的函数。根据Pew的观点，对这种方法提出了两个问题：（1）由于操作行为随模拟器的冻结而被终止，此时的情境认知评估会不会准确？（2）进一步的调查会不会改变飞行员的行为？即当试验任务被冻结，这本身是否给情境认知评估增加了一些新的变量？目前对“冻结”方法的有效性问题，Endsley专门设计了多个实验进行了分析和比较，其中包括一组有关空对空作战飞行员的“冻结”实验，实验结果证明该方法对操作行为和情境觉知的影响都不明显。

2、情境认知主观测量方法的比较

表1.1情境认知主观测量法影响因素的属性矩阵表

属性/测量	SART	SAGAT	SWORD	CSA	SASRF
谁
自评	▲	▲	▲
他评				▲	▲
什么
直接SC	▲		▲
SC资源	▲		▲		▲
SC认识/记忆	▲	▲
SC过程				▲	▲
操作				▲	▲
哪里
绝对	▲	▲		▲	▲
相对			▲
何时
试验中		▲		▲	▲
试验后	▲		▲

表1.1提供了一个对情境认知主观测量方法的总结。下面是对表中所列方法的简要描述及评论。

情境觉知评估方法（SART Situation Awareness Rating Technique）

SART（Selcon 和Taylor）是用来评估操作人员（如飞行员）觉知的主观测量方法，主要包括三个方面：（1）对注意资源的需要；（2）注意资源的供应；（3）对情境觉知的综合理解。也就是说，SART是把所讨论的注意能量（最小需求）及情境觉知的综合感知作为操作人员（如飞行员）的工作负荷进行测量。其主要作用是测量基于规则的操作行为和基于知识的决策，Pew认为这种方法的坏处在于掺杂了操作人员（如飞行员）的自信与习惯，尽管如此研究者仍可以获得一些结论以指导进一步的研究。

情境觉知综合评估方法（SAGAT Situation AwarenessGlobal Assessment Technique）

SAGAT（Endsley）调查方法，要求参加者在试验（如驾驶模拟器）进行某一点时暂停并在重新开始前回答有关自己对环境的认识及评估方面的问题。SAGAT提供了一个较简单的飞行员心理模型描述，涉及了有关情境认知的许多要素，并通过容易的记录和评估提出一个对飞行员（本身）的情境认知评估的直接测量。使用这种方法可以获得有关特定情境认知综合水平的大量数据，美中不足的是，SAGAT要求暂停模拟以便于收集数据，如果设计不当，则会干扰试验任务的正常进行。

情境觉知-主观工作负荷支配（SWORD SA-Subjective WorkloadDominance）

SA-SWORD方法（Vidulich），就是让两个操作者基于各自的情境认知/工作负荷感受来比较不同的设计。但是这种方法的缺点在于：很难对习惯与较高的情境认知之间的选择作出区别。

机组成员情境觉知法（CSA Crew Situational Awareness）

CSA方法（Mosier 和 Chidester）是用来测量运输机机组成员间情境觉知的一种方法。由专家评价机组成员之间的信息交互协作和操作反应错误。该方法对测量错误类型和决策提示非常有效，但是需要机组成员之间的频繁通讯，并且需要许多专家共同制定信息交互的测量指标。

情境觉知监测评估表（SASRF Situational Awareness Supervisory Rating Form ）

SASRF（Caretta, Perry 和 Ree）方法的研究起源于对F-15飞行员的情境认知测量。该评估表有31个条目，从一般特征到战术使用的方面都有涉及。由主试或同伴进行评估。Caretta等认为在主试与同伴评估中的92.5%不一致是因为飞行经验。

1.1.2 情境认知的客观测量方法

1、基于操作绩效的测量方法

基于操作绩效的测量方法具有客观、非侵入、易收集等特点。但是基本操作的绩效测量存在着精度问题，并造成局部的测量误差，进而影响情境认知中变量测量的准确性和规律性。针对上述问题，一些学者使用更具体的任务作为情境认知测量的指标，如Hansman 等使用允许补偿误差的方法测量机组成员间的情境认知（使用自动数据链系统）；Zenyuh,Reising, Walchi and Biers把测量目标搜索任务的操作作为评估立体显示中的飞行员情境认知指标。

2、嵌入式情境认知的测量方法

由于通过直接的操作测量评估情境认知的研究较少，所以更普遍的方法是采用在某个模拟场景中间接、嵌入地操作测量以评估具体的情境认知问题。Sarter 和Woods在1991年首先使用了这种方法。当研究飞行员的操作行为是否会被某些事件的发生影响这个问题时，Pew提出了一个作为嵌入式操作测量的例子：

（1）第一个场景包括违反直觉的指示或较少的引导，在并行跑道上驾驶一架飞机，此时飞行员的反应时作为对空间及周围活动的情境认知；（2）第二个场景使飞行员失去方向感，如取消飞行仪表并测量飞机返回原来航线上的时间（即显示恢复时间）。Andre 等在比较2-D与3-D导航显示器的研究中使用了该方法。该场景涉及到仪表数据的异常，并在要求的时间内评估检测反常现象的情境认知，此时，飞行员注意力的集中应保持在被操作的数据上以便确保情境认知的任何变化都能被精确地测量到。

Endsley认为嵌入式情境认知的测量（依赖于设计的场景）要求过多地影响了操作者，使之不能通过自己的方式处理一些情境认知的问题。对此，Wickens提出了内隐情境认知的测量方法（在这里Wickens把内隐看作是非侵入的意思），其基本原则是使用较高的情境认知操作新任务时远好于使用较低的情境认知处理。该方法的缺点是较差的操作可能是较低的情境认知或较差的决策、执行造成的。

另一个间接、嵌入式评估情境认知的方法是信号检测理论（Fracker），具体如下：“假设事件X发生。如果飞行员意识到该事件的发生，那么他将以一种方式反应（击中）；但是如果没有意识到该事件的发生，那么他将以一种不同方式反应（漏报）；同时对虚报和正确否定的测量也是必要的。一旦在执行任务过程中这四种反应被分别记录下来，可以用几种方法计算飞行员的感觉灵敏度。由于如果飞行员没觉察到事件发生，那么其感觉灵敏度下降，反之，其感觉灵敏度增加，这种方法包括了对特定事件的经验和直觉推理的测量。”

Fracker规定若使用这种评估情境认知的方法必须满足三个测量标准：首先，目标事件及其反应必须是明确清晰的、可计算的；其次，目标事件及其反应必须都是有限的；最后，目标事件及其反应是一一对应的。

Green及其同事（Odom 和 Yates）根据信号检测理论于1995年提出了一个“理想观察者” 模型。在这个模型中，任务操作仅由三个因素限制：外部噪声、内部噪声和功效（从外部环境采集信息的能力）。其优点在于，通过一个相对标准实现对情境认知的绝对测量，并可用多个显示或任务进行情境认知的比较研究。通过一个评估圆点的任务，研究者们使用模型预测了一个操作者在噪声中的决策能力，并确定了减小噪声、增大功效的因素。研究发现：在观察者中，不同程度的噪声和功效可被检测到并与模型预测的相一致。

Gugerty和Tirre使用信号检测理论在1995年也提出了一个基于操作的嵌入式的任务测量以评估情境认知。他们把对刺激的错误反应当作“击中”，故而把危险检测（觉知）的记录从其他所有的决策/执行动作过程分离出来。这个结果是情境认知过程从全部操作中分离后得到的，而全部操作则是觉知与决策/执行动作过程的综合体。

Sarter和Woods于1991年也提出了一个嵌入式场景操作评估情境认知。在该方法中，通过以某种出乎意料的方式改变显示信息（从而使模拟也得到了改变），同时测量操作者是怎样、什么时候注意到这个变化。

3、基于生理指标的情境认知测量方法

有许多情境认知的生理测量方法被提出，如脑电图描记器(EEG)、眨眼率等。这些测量方法中的一些能够证实从环境中提取的信息是否已被认知注册。然而，由于一个人必须从所看到的、所理解的信息中进行推理，因而通过这些方法并不能准确地知道哪些信息被记忆、哪些信息被正确地感知、哪些信息被综合理解。

4、基于特征指标的情境认知测量方法

情境认知特征测量的目的是为了在不同操作者的情境认知能力的基础上发现感知、能力、智力上的个体差别。例如，Bolstad在1991年设计了一套飞行员情境认知特征测量测试系统，主要包括：空间能力、注意、记忆、感知能力、识别能力及性格因素。并与SAGAT测试（两者之间具有很高的相关性）得分相结合对飞行员的情境认知能力进行综合评判。

McMillan于1994年提出了另外一个用于测试情境认知发生及保持的特征、技能、能力的系统，并对一个中队的空军飞行员进行了专家打分，主要包括：工作记忆能力、多任务操作能力、空间知觉能力等。

5、基于过程/行为的情境认知测量方法

顾名思义，情境认知的过程测量与情境认知的结果测量联系较少，更多的是获得情境认知的过程及策略。眼动跟踪仪就是一个测量操作者信息获得及注意分配过程的范例。口头协议则是获得并保持情境认知过程的又一过程方式（Sullivan和Blackman）。Mosier和Chidester于1991年使用通信频率作为商业驾驶舱中组员间情境认知的测量指标。Tenney等在1992年提出了一个基于模式的情境认知过程测量方法，使用这种方法，可以把人的模式行为动作、知识状况、信息处理策略等编程处理以得出情境认知。这种方法允许研究者弄清支持有效情境认知的层次结构。其好处在于可以不打断正在进行的模拟试验收集数据。

根据Tenney等人的想法，一个人-机操作模型应包括：（1）一个设定的环境；（2）有一些系统因素可以影响人的操作控制性能；（3）在人-机交互中有具体的目标和任务；（4）表现出人的操作能力和限制，如视觉扫视规则及基于资源的工作负荷限制。在有过多的监视要求和任务负荷情况而的情况下，该模型通过跟踪记忆内容和任务执行程序可以提供线索提示缺乏情境认知与否。

1.1.3 情境认知各种测量方法的比较

通过分析我们可以看出，以上这些不同类型的情境认知测量方法，每一种都有其适用的范围，都有各自的优缺点。由于大多数情境认知的定义都是以结果为基础的，所以大多数测量都是评估情境认知结果的，只有少数是针对情境认知的特征、过程或条件的。如果不考虑这些差别，那么是很容易选择测量方法的。通过对情境认知测量的讨论我们可以得出以下结论：

首先，测量方式是根据研究者可操作的情境认知定义来选择的，要用绝对统一的条件评论不同的测量是比较困难的，这是由于研究者对情境认知的概念、可操作定义的不同造成的。

其次，如果大多数情境认知的研究都是基于结果的，那么大多数情境认知的测量则大都是集中在对情境认知的结果的评估上。

再次，大多数研究者采用照字面的的方式去定义认知，这是因为他们情境认知的测量仅仅揭示了操作者所意识到的（外显的知识）和那些通过主观的调查能够清楚说明的知识。如此，他们就不能获得操作者的内隐知识。相比之下，一些研究通过使用嵌入式的任务操作指标试图揭示内隐的（和外显的）情境认知，但是，这些方法常常忽略了情境觉知、决策和反应选择间的区别。

最后，几乎所有的情境认知测量都缺乏一个演绎的标准定义。毕竟，如果在测量情境认知之前，我们没有定义一套外部目标及达到这些目标的标准，那么我们又怎么能判断一个操作者情境认知的绝对质量呢？所以，对情境认知的研究需要一套完整的测量（包括对特定情境下的注意、工作负荷及操作者内隐和外显情境认知的综合）方法，既包括陈述性的形式又包括程序性的形式，这将有助于理解注意、工作负荷对该情境下操作者认知的影响。总之，在对任何情境认知测量评估之前，首先要建立一套情境认知的标准测量方法。

1.2 情境认知测量方法的完善

我们认为：在飞行过程中，当检测到某个信号或事件（如仪表/外景变化）被触发时，飞行员一般会通过注意力分配测定它的紧急程度、程序及与目标的联系，形成内隐/外显的情境认知；同时，飞行员的经验、操作绩效差别也反映出情境认知的水平变化情况，对于有经验的飞行员，许多特定情境的出现常常会激活他的熟练操作模式，从而反映出他们出众的训练水平或信息处理能力，或完全的情境认知评估技能，以至于在不增加工作负荷的情况下产生“自动性”反应，进而可以在不出错的情形下从事多项任务。

评估、测量不同熟练程度飞行员的认知过程及策略的方法很可能有利于洞察每种情境认知及策略的好坏，因此，我们对情境认知的测量不仅要考虑不同工作负荷下的操作绩效，还将把认知过程（尤其是扫视和注意力分配）作为形成飞行员情境认知的基本因素来考虑。这对于量化飞行员情境认知技能的训练或飞机座舱人机交互界面的设计都是非常重要的。另外，我们的测量方法既要考虑情境认知结果又要考虑过程。

为开发一个有效的、综合的方法去研究飞行员情境认知的测量，需要重点考虑下列问题：

（1）不同任务阶段情境下飞行员的扫视（注意）变化；

（2）工作负荷与任务难度的关系；

（3）工作负荷与情境认知的关系；

（4）经验与情境认知的关系。

下面将分别对这几个方面进行阐述。

1.2.1 使用SAGAT调查法研究扫视（注意）变化情况

要求飞行员在试验（驾驶模拟器）进行某一点时暂停并在重新开始前回答有关自己在当前情境下对各仪表或外景的扫视（注意）策略情况。比较不同级别被试的测试结果。其具体测试过程如下：

（1）飞行员飞一个模拟阶段；

（2）模拟在关键处暂停，情境不消失；

（3）按编排的问题调查飞行员在此时对各仪表/外景变化的扫视（注意）策略情况；

（4）试验结束后，把飞行员的回答（觉知的）进行实际记录，得出较客观的情境认知测量结果；

（5）通过被试重复两次试验以获得满足要求的有意义的结果。

1.2.2 使用NASA-TLX及SWAT法调查飞行员的工作负荷

飞行员工作负荷的主观测量方法是指让飞行员陈述飞行过程中的脑力负荷体验或根据这种体验对飞行作业项目进行过程排序、质的分类或量的评估。方法的理论基础是操作者心理资源耗费的增加同他的努力程度联系并能准确地表达出来。

典型的主观测量方法是三个等级量表NASA—TLX量表、主观负荷评价技术SWAT和修正的库柏哈柏法MCH。NASA—TLX量表涉及到六个负荷因素，心理需求、生理需求、时间需求、操作绩效需求、努力需求和挫折，这些因素被赋予不同的权重，评价结果是一个总的负荷评价。SWAT方法把时间、压力和努力看作是三个引起脑力负荷的主要因素。每个因素有分高、中、低三个水平，最后合并成一个脑力负荷测量测量指标。MCH量表由一系列的的问题组成，是评价飞机驾驶难易程度的的单维量表，可进行作业负荷的综合评价。NASA—TLX和SWAT量表是多维量表，在敏感性和诊断性方面效果相近。但是，NASA—TLX和SWAT方法分别是通过各自不同的维度测量诊断性的。这三种主观测量方法间存在一定的相关，在航空界都有广泛的应用。

主观测量方法的主要好处首先在于，这是一种脑力负荷的直接评定方法，操作简单，容易让操作人员接受；其次，由于是事后进行，方法不对主任务产生侵入性，Eggermeier和Wilson研究发现，如果不是复杂的多任务操作，任务完成后30分钟内的脑力负荷评价结果没有多大差异。主观测量方法使用统一的维度评定，可以对不同情境、不同机型和不同飞行员的负荷测量结果对比。此外，主观评定不仅能区分超负荷与非超负荷，而且对中、低负荷水平的变化也较敏感。由于这种方法效度高、无侵入性，使用经济，近20年来一直受到研究人员和使用者的重视，是最受欢迎的脑力负荷测量方法。

我们采用的方法就是要求飞行员在试验（驾驶模拟器）结束后结合NASA-TLX和SWAT调查表制定的有关问题进行打分（NASA-TLX和SWAT调查表详见附录1）。

1.2.3 研究不同阶段中工作负荷与情境认知间的关系

飞行员情境认知测量的影响依赖于具体情境下被试工作负荷情况的变化。当前国外测量情境认知时，大都研究相应情境下的工作负荷变化情况。最新的研究结果表明两者之间并不存在一致性关系。

1.2.4 使用不同的飞行员比较经验与情境认知间的关系

有关情境认知研究的一系列心理问题，概括起来分为以下两组：（1）感知-运动问题；（2）认知问题。感知-运动问题包括感觉的敏锐度（如视觉）、感知和模式的识别、运动控制。有证据表明在飞行中的感觉敏锐度是可以训练出来的。认知问题包括自动性、近极限处理和熟练的记忆。

高级飞行员高超的技术常常可以通过具体环境中的熟练操作表现出来，也可以从他快速准确地对环境线索和模式进行评估的能力（作为高层情境认知建立与保持过程的一部分）分析出来。一般认为高级飞行员具有多种事件模式的记忆储备并可以在需要时提取出来。

评估这种表现出来的知识储备程度很可能是有关准确测量飞行员知识和记忆（内隐情境认知的一部分）的一个基本因素。高级飞行员常常能够凭借他的经验从得到的线索或模式中得出准确的推理，进而在复杂多变的环境中作出正确的决策并采取相应的行动。然而，他们经常不能清楚地说出在评估中注意的线索及怎样运用的这些线索。通过调查分析高级飞行员与飞行员学员在情境中扫视线索或模式的能力及其对决策、操作绩效的影响程度的差异来反映，这也可能是测量经验与情境认知的一种有效途径。

我们将采用测试不同级别飞行员情境认知有关特性的对比研究方法，通过检测飞行员个体情境认知品质之间的差异来反映经验与情境认知的关系。

总之，我们对上述四种关系的研究将涉及到情境认知的过程及其结果，即我们的方法既包括对过程的测量，也包括对结果的测量，较好地解决了有关测量情境认知的争议问题（应该测量其过程还是结果的问题），为情境认知定量评价模型的有效验证打下了基础。