菲兹定律

介绍

人类运动在计算中无处不在。我们的手臂、手腕和手指忙于键盘、桌面和接触敏感显示器。因此,将人的运动极限和能力与计算系统上的交互技术相匹配是人机交互(HCI)研究的一个重要领域。相当多的HCI研究是针对建模、预测和测量人类性能。在人类运动领域,菲茨定律是本研究的杰出模型。适用菲茨定律的人类活动的全谱比上款所举的手臂、手腕和手指三个例子更广。在诸如游戏、虚拟现实或可访问计算等欺骗文本中,动作还可能涉及躯干、腿、脚、眼睛、脸、舌头、嘴唇、皮肤、头部等。值得注意的是,对于每一种输入模式,都有使用Fitts定律来探索设计空间或量化人类性能的例子。本章概述了费茨定律。我们将看到,菲茨定律是预测和测量的模型。对于预测,Fitts定律是一个方程,它给出了根据移动距离和目标大小获取和选择目标的时间。对于度量,Fitts定律提供了一种方法,可以用单个度量(吞吐量)来量化人类的性能。吞吐量,在本章后面描述的计算中,结合了执行目标捕获任务的速度和准确性。我们从背景细节和菲茨定律的简单介绍开始,然后描述了修正缺陷或改进模型的预测能力或理论基础的改进。近年来,由于ISO 9241 9 (ISO, 2000)标准的出现,计算机输入技术的Fitts定律评价更加一致。总结了标准中使用的菲茨定律方法,并给出了实现这些方法的软件工具。由于Fitts吞吐量是此类评估的主要性能度量,我们还根据最佳实践方法详细计算了吞吐量。然后,我们给出了一个使用Fitts定律和ISO 9241 9来衡量人类绩效的例子。这个例子涉及到基于触摸的目标选择与一个具有接触敏感显示器的手机。

背景

和上世纪50年代的许多心理学家一样,Fitts也有动机去研究人类的表现是否可以用信息论这个令人兴奋的新领域的隐喻来量化。这个领域是香农、维纳和其他数学家在20世纪40年代的工作成果。当实验心理学家探索测量和建模人类行为的最新技术时,“概率”、“冗余”、“位”、“噪声”和“通道”这些术语进入了他们的词汇表。这方面的两个著名模型是希克-海曼选择反应时间定律(希克,1952;(海曼,1953)和菲茨定律为人类运动系统的信息容量(菲茨,1954)。
Fitts特别感兴趣的是快速瞄准移动,即人类操作者在一定距离内获取或选择一定大小的目标。Fitts提出了一个模型——现在称为“定律”——广泛应用于人机工程学、工程学、心理学和人机交互等领域。Fitts定律的起点是一个称为Shannon定理17的方程,它给出了带宽为B (s - 1或Hz)的通信信道的信息容量C(以比特/秒为单位)为
在这里插入图片描述
其中S为信号功率,N为噪声功率(Shannon & Weaver, 1949,第100-103页)。Fitts认为,人类操作者在一定幅度内运动,以获得一定宽度的目标,这显示了“信息传输速率”(Fitts, 1954, p. 381)。在Fitts的类比中,运动振幅类似于信号,目标公差或宽度类似于噪声。
Fitts提出了一个目标获取任务的难度指数(ID),使用一个对数项,从式17.1稍微重新排列。将信号功率(S)和噪声功率(N)分别替换为运动幅度(A)和目标宽度(W):
在这里插入图片描述
Fitts将目标宽度称为“允许变异性”或“运动容忍度”(Fitts, 1954, p. 382)。这是运动开始的区域。与式17.1中的log项一样,ID的单位是位,因为括号内的比率是无单位的,并且log以2为底。
Fitts的想法之所以新颖,有两个原因:首先,它提出了利用信息度量位来量化目标选择任务的难度。其次,它介绍了这样一种观点,即执行目标选择任务的行为类似于通过通道(人类通道)传输信息。Fitts把传输率称为性能指标,尽管今天的术语吞吐量(TP)更为常见(为了保持一致性,在本章中使用了吞吐量这个术语)。
吞吐量是通过一系列试验以简单商数计算的。任务难度指数(ID)为分子,平均移动时间(MT)为分母:
在这里插入图片描述
ID以位为单位,MT以秒为单位,TP的单位是位/秒或位/秒。Fitts工作的一个中心论点是吞吐量与运动幅度和目标宽度无关,就像嵌入到ID中的那样。换句话说,随着ID的变化(由于A或W的变化),MT以相反的方式变化,而TP保持更多或更少的恒定。
当然,吞吐量会受到其他因素的影响,比如设备、交互特性或环境。在Fitts的原始实验中,对两种设备进行了比较(见下一节)。在HCI中,可以使用Fitts的吞吐量作为因变量来探索大量的因素或自变量。例如“设备”(鼠标对触控笔对轨迹球,见MacKenzie, Sellen, & Buxton, 1991),带有眼动跟踪器的“停顿间隔”(700 ms对500 ms,见Zhang & MacKenzie, 2007),或“设备位置”(受支持的与移动设备相比,见MacKenzie, 2015)。吞吐量作为一个因变量尤其具有吸引力,因为它将速度和准确度结合在一个度量中(使用一种稍后将介绍的技术)。
在上面提到的Fitts定律的两种用途中,预测和测量吞吐量是使用Fitts定律进行测量的一个例子。

例子

最初的研究(Fitts, 1954)涉及四个实验条件:两个交互或串行的攻丝任务(1 oz触头和1 lb触头)、一个磁盘传输任务和一个pin传输任务。在轻敲条件下,参与者以最快的速度在两块板之间来回移动触控笔,并在板的中心轻敲触控笔(见图17.1a)。Fitts后来设计了任务的离散变体(Fitts & Peterson, 1964)。对于离散任务,参与者根据刺激光选择两个目标中的一个(见图17.1b)。图17.1中的任务通常称为“Fitts范式”。“很容易想象,如何使用当代计算技术来更新Fitts的设备。
菲茨发表了他1954年实验的总结数据,因此对他的结果进行重新检查是可能的。在触控笔‐触控条件下,四个目标振幅(A)与四个目标宽度(W)交叉
在这里插入图片描述
图17.1 Fitts范例。(a)连续敲打任务(Fitts之后,1954年)(b)离散任务(Fitts & Peterson之后,1964年)。
表17.1 Fitts(1954)用1 oz触控笔连续敲击任务实验数据。一个额外的列显示了调整W的百分比错误后的有效目标宽度(We)(参见文本)。
在这里插入图片描述
两个持续15秒的试验序列。(在当前的实践中,“序列”通常是指定的试验次数,例如25次,而不是指定的时间间隔。)表17.1给出了1oz触控笔状况的汇总数据。除了A和W,表中还包括错误率(ER)、难度指数(ID)、移动时间(MT)和吞吐量(TP)。如前所述,添加了有效目标宽度(We)列。
表17.1中的条件组合产生的任务难度从1位到7位不等。观察到的平均MTs从180 ms (ID = 1位)到731 ms (ID = 7位)不等,每个平均值来自16名参与者的600多个观察结果。MT值的标准差为157.3 ms,为均值的40.2%。这是完全预料到的,因为“困难的任务”(例如,ID = 7位)显然要比“简单的任务”(例如,ID = 1位)花费更长的时间。
Fitts通过将ID除以MT(式17.3)来计算每个任务分配的吞吐量。平均吞吐量为10.10位/秒。快速浏览表17.1中的TP列,可以为本文提供强有力的证据,即信息处理的速度相对独立于任务难度。虽然任务难度较大,但TP值的标准差为1.33位/秒,仅为均值的13.2%。
将表17.1中的数据和ID对TP的独立性可视化的一种方法是通过散点图显示每个任务条件下的MT‐ID点。图17.2显示了表17.1中数据的这种图表。图中还包括最佳拟合线(通过最小二乘回归)、线性方程和平方相关。ID对TP的独立性反映在点与回归直线的距离上(表示ID/MT比值不变)。确实,模型拟合效果很好,解释了96.6%的方差。
在这里插入图片描述
图17.2表17.1数据的散点图和最小二乘回归分析。
图17.2中的线性方程一般形式如下:
在这里插入图片描述
回归系数包括单位秒的截距a和单位秒/位的斜率b。(在解释式17.4中的斜率和截距系数时,出现了一些有趣但困难的问题。由于篇幅有限,这里不作详细说明。感兴趣的读者可参阅2004年Soukoreff & MacKenzie的第3.4和3.5节。)方程17.4例举了菲茨定律在预测中的应用。这与使用菲茨定律进行测量的式17.3形成了对比。

菲茨定律的修正

自1954年首次出版以来,对菲茨定律提出了许多修改或改进意见。虽然在理论和实践中都有考虑,但一个普遍的基本原理是需要在HCI和其他领域中使用精确的数学公式来进行测量。人们可以想象(并希望),不同的研究人员使用菲茨定律来研究类似的现象,应该会得到类似的结果。只有就收集和应用数据的方法达成普遍协议,这才有可能。
改变或改进Fitts定律的早期动机源于观测结果,即MT‐ID数据点偏离回归线,且最大偏离点位于ID = 1位。在图17.2中最左边的一点可以清楚地看到这一点。为了改进数据对模型的拟合,维尔福德(1960,1968,第147页)引入了以下公式:
在这里插入图片描述
多年来,这个版本的ID被频繁地使用,特别是在Card、English和Burr(1978)对计算机鼠标的比较评估中。(1978年Card等人对结果进行了重新分析,2003年MacKenzie和Soukoreff基于当代对菲茨定律的理解,对结果进行了重新分析。)Fitts在1968年的一篇论文中也使用了Welford公式,并报告了与Fitts公式相比,回归线拟合的改进(Fitts & Peterson, 1964, p. 110)。
1989年的研究表明,菲茨根据香农定理的近似推导出了这种关系,而香农定理只适用于信号‐噪声比较大的情况(菲茨,1954年,
p。388;戈德曼,1953年,第157页;麦肯齐,1989,1992)。香农定理中的信号‐噪声比在Fitts的类比中表现为A‐‐W比值。如表17.1所示,Fitts触头‐敲击实验中的A‐W比扩展至1:1 !通过与香农信息定理的直接类比,得到了菲茨难度指数的变化
在这里插入图片描述
除了与信息论的改进联系外,被称为Shannon公式的Eq. 17.6比Fitts或Shannon公式- tion具有更好的相关性(MacKenzie, 1989,表1和表2;1991年,表4;2013年,表3)。
香农公式的另一个特征是,ID不能为负。显然,对任务难度的负面评价是一个严重的理论问题。尽管负ID的可能性似乎不大,但Fitts的法律文献中实际上已经报道过这种情况(Card et al., 1978;克罗斯曼&古德夫出版社,1983年;Gillan, Holden, Adam, Rudisill, & Magee, 1990;《威尔与迈克尔连》,1987)。对于香农公式,负ID是不可能的。如图17.3所示,它显示了当A接近0时ID平稳地接近0位。在Fitts和Welford公式中,小A的ID值为负。
在这里插入图片描述
图17.3使用Shannon公式,当A趋于0时,ID趋于0位。

调整准确度

更重要的是通过根据人类操作员在一系列试验中的输出响应的空间变化来调整指定的或设定的目标宽度(类似于噪声)来改进Fitts定律中的信息理论规范的技术。这个想法最初是由Crossman于1957年在一份未发表的报告中提出的(引自Welford,1968,第147页)。后来,Fitts(Fitts&Peterson,1964,p.110)对这一调整的使用进行了审查和认可。
输出或有效目标宽度(W)来自“命中”的分布(参见MacKenzie,1992,第3.4节; Welford,1968,第147-148页)。这种调整位于信息理论隐喻的核心 - 运动放大器类似于“信号”,端点可变性(即目标宽度)类似于“噪声”。事实上,信息定理是基础Fitts定律假设信号“受到白热噪声的干扰”(Shannon&Weaver,1949,p.100)。运动任务中的类似要求是高斯或正常的命中分布 - 许多研究人员观察到的属性(例如,Fitts&Radford,1966; MacKenzie,1991,p.84; 2015; Welford,1968,第154页)。
归一化输出测量的实验意义如下所示。正态分布中的熵或信息是log2(V2xeo)= log,(4.133 o),其中o是测量单位的标准偏差。将常数4.133分成一对单位正态曲线的分数(即o = 1),可以发现总面积的96%受-2.066 << + 2.066的限制。换句话说,目标宽度类似于噪声的条件是分布是正常的,96%的命中落在目标内,4%的命中错过目标。见图17.4a。当观察到除4%之外的错误率时,调整目标宽度以形成与基础理论一致的有效目标宽度。
有两种确定有效目标宽度的方法,标准去除方法和离散误差方法。如果已知终点坐标的标准偏差,只需将SD乘以4.133即可得到W.如果只知道误差的百分比,则该方法对单位法线曲线下的区域使用 - 得分表。表格可以在大多数统计学教科书的附录中找到; z-score也可以使用Microsoft Excel中的NORM.S. INV函数获得。)以下是方法:如果在特定AW的一系列试验中观察到n%的错误条件,确定s使得±包含单位法线曲线下面积的100-n%。
将W乘以2 066。我得到了。例如,如果在选择5厘米宽的目标时在一系列试验中发生2%的误差,那么W.=2.066W/Z=2:066×5/2.326=4.45.cm。见图17.4b。从广义上讲,这个数字表明当误差率小于4%时We <W,而当误差率超过4%时We> W。
使用调整或有效目标宽度的实验通常会发现IP的变化减小,因为速度 - 准确性权衡:花费更长时间的参与者更准确并且表现出更少的端点可变性。减少的终点可变性会降低有效目标宽度,从而增加有效的难度指数(见方程17.3)。反过来也是如此。总的来说,增加图17.4根据选择分布调整目标宽度的方法。(a)当发生4%误差时,有效目标宽度为W.-W。(b)当发生误差小于4%时,We<W。
在这里插入图片描述
图17.4根据选择的分布调整目标宽度的方法。 (a)当发生4%误差时,有效目标宽度We = W.(b)当误差小于4%时,We <W。
这项技术可以追溯到1957年,但在随后出版的《菲茨定律研究》(Fitts ’ law research)中,它基本上被忽略了。有几个可能的原因。首先,该方法是棘手的,它从信息理论原理推导出来是复杂的(参见Reza, 1961, pp. 278-282)。其次,每次试验必须记录选择坐标,以便从标准差计算We。使用计算机进行数据采集和统计软件进行分析是可行的,但是手工测量和数据录入是非常困难的。
当调整使用误差百分比(离散误差法)时,可能会出现误差,因为涉及到单位正态分布的极端尾部。有必要使用z‐在保理比率上的精度至少有三位小数的分数(乘以W得到We)。手工查找方法容易出现精度错误。此外,一些较简单的实验条件的错误率可能太低,无法揭示命中的真实分布。该技术不能适应“完美的性能”!表17.1给出了一个条件A=W=2in的例子。Fitts报告的错误率为0.00%,这似乎是合理的,因为目标边缘正在接触。这个观察意味着一个很大的调整,因为与命中应该分布的目标宽度相比,这个分布非常窄——有4%的误差!在这种情况下,一个实用的方法是假设最坏的情况错误率为0.0049%(四舍五入为0.00%),然后进行调整。
如前所述,引入目标宽度的特别调整对于维持信息理论类比非常重要。在Fitts的lais中有一个默认的假设,即参与者虽然被要求“尽可能快速和准确地”移动,但仍要平衡任务的需求,以满足96%的点击率落在目标范围内的空间限制。当不满足这个条件时,就应该进行调整。还要注意,如果参与者放慢速度,过分强调准确性,任务就会发生变化;约束变为时间约束,模型的预测能力下降(Meyer, Abrams, Kornblum, Wright, & Smith, 1988)。综上所述,Fitts定律是一个快速、有针对性的运动模型,假设参与者行为中存在一个名义上但一致的错误率,这一点可以说是至关重要的。
表17.1包括一个额外的列为有效目标宽度(我们),计算使用离散‐误差方法。使用We和Shannon公式对表17.1中的数据进行重新分析,得到难度指数如图17.5所示。模型拟合得到改善(R2 = .9877),数据点更接近最佳拟合直线。对于简单的任务,偏离回归线的曲线似乎得到了纠正。注意,使用经过调整的度量,IDs的范围更窄(参见图17.2和图17.5)。这是因为当ID大于2位时,1‐位会减少(见图17.3),而对于“简单”任务,由于命中的分布较窄,ID通常会增加。
在这里插入图片描述
尽管Fitts的设备只记录了“命中”或“未命中”,但现代的基于计算机的系统通常能够记录目标选择的坐标。(也有例外。采用驻留时间选择的交互方法通过将光标保持在目标内一段规定的时间间隔来执行目标选择。本身没有选择坐标。停留时间选择的示例包括使用眼动仪的输入,例如MacKenzie,2012和Zhang&MacKenzie,2007,或基于倾斜的输入,例如Constantin&MacKenzie,2014,以及MacKenzie&Teather,2012。)
如前所述,这些数据允许使用标准偏差方法来计算W.因此,也可以计算有效幅度(A。) - 移动的实际距离。如果选择围绕目标的中心分布,则A的使用几乎没有影响。但是,重要的是使用A.来防止“游戏系统”。例如,如果所有移动都不足并且仅移动,例如4×A,则如果使用A计算,则人为膨胀。使用A.防止这种情况。这是使用“有效”价值观的整体前提的一部分。参与者可以获得他们实际所做工作的信誉,而不是他们被要求做的事情。

什么是菲茨定律

在这个时刻,值得退一步考虑大局。什么是菲茨定律:在前面提到的Fitts难度指数的改进中,只提出了Welford和Shannon公式。虽然存在其他配方,但这里不再对它们进行评述。有一个原因。在大多数情况下,在一个简单的过程之后引入了替代的配方:提出了一个变化并进行了合理化,然后提出了一个新的预测方程,并通过实证检验了拟合度。研究人员经常以一种一心一意的方式进行这项工作。目标是改善拟合。更高的相关性被认为是变化改善模型周期的证据。但有一个问题。改变模型的等式通常缺少单位“比特”的任何术语。因此信息隐喻就丢失了。这可能由于各种原因而发生,例如使用非日志形式的ID(例如,幂,线性),插入新术语,或将日志术语拆分为A和W的单独术语。如果没有术语单位“比特”,没有吞吐量。虽然这些模型可能确实有效,但将其描述为对费茨定律的改进,或者甚至作为对费茨定律的变化,可以说是错误的。它们是完全不同的模型。
上段所采取的立场有两点。首先,Fitts法则的预测形式(公式第17.4节)没有出现在Fitts最初的1954年出版物中。因此,仅仅为了改善预测方程的拟合而做出的任何努力是否属于费茨的法律研究领域是值得怀疑的。其次,Fitts定律基本上是关于buman电机系统的信息容量(Fitts’1954论文的标题以斜体字设置开头)。 Fitts定律的真实实例是吞吐量的方程式17.3,它出现在原始论文中,虽然标签不同(Fitts,1954,Eq.2)。因此,保留信息隐喻是费茨法律的核心。

ISO 9241‐9

在第一次出版(Fitts,1954)之后的几十年中,许多菲茨的法律研究出现了 - 并且形式多种多样。这些研究的内部有效性不存在问题,但这一研究体系存在相当大的不一致性,这使得跨学习比较成为一项艰巨的任务。简而言之,通常无法将一项研究的吞吐量值与另一项研究的吞吐量值进行比较。仔细阅读,细节往往不充分。在给出详细信息的情况下,很明显吞吐量通常以不同方式计算。此外,收集的数据或数据在建立Fitts法律模型或计算吞吐量方面的工作方式存在不一致。显然,Fitts的法律研究可以从标准化方法中受益。在人机交互中尤其如此,必须评估新想法的实际好处,并与其他出版物中的相关想法进行比较。输入ISO9241-9。
ISO标准由来自研究和应用研究社区的技术委员会编写。与人机交互相关的一个标准是多部分ISO9241,“具有可视显示终端(VDT)的办公室工作的人体工程学要求。”草案版本开始出现在20世纪90年代。第9部分是“非键盘输入设备的要求”(国际标准化组织,2000年)。该标准已更新为更通用的标题“人机交互的人机工程学。”这些部分也已更新,重命名和重新编号。第9部分现为第411部分,“物理输入设备设计的评估方法” (国际标准化组织,2012)。(本章中参考ISO 9241-9也适用于ISO 9241-411。关于Fitts法律测试程序,两个版本是相同的。)该标准与几乎任何可以在计算机上执行点选操作的输入机制。如果ISO 9241-9有一个主要优点,那就是将Fitts法律应用于HCI投入研究的标准化。
ISO 9241-9中的两个主要性能测试程序采用了Fitts的范例。存在一维(1D)任务和二维(2D)任务,两者都使用串行目标选择。包括2D任务是对Fitts定律的实用扩展,以支持计算系统中常见的交互。虽然Fitts描述了离散任务的可能性(见图17.1b)并且在一些Fitts法律研究中使用,但是离散任务不包括在ISO 9241-9中。
在这里插入图片描述
图17.6 ISO 9241-9中(a)一维(Fitts任务一)和(b)二维(Fitts tasktwO)任务的实现。 (c)一系列试验后的弹出对话框来自作者实现的屏幕快照如图17.6a所示,适用于FrTTsTASKONE(1D),图17.6b适用于FrrrsTASKTwo(2D)。(这些可以免费下载到http:// www.yorku.ca / mack / FittsLawSoftware /下载包括Java源代码和类文件,可执行JAR文件,示例和详细API。)对于2D图像,虚线叠加以显示目标选择的顺序。当选择每个目标时,突出显示移动到布局圆上的一个位置,以显示参与者的下一个目标。图17.6c显示了使用带有FrrrsTAskTwo的鼠标进行一系列试验后的典型弹出对话框。在此上下文中,对于鼠标,吞吐量值通常为4.9位/秒。
在过去15年左右的时间里,ISO 9241-9和Fitts的范例已被用于许多研究中。根据标准评估的新型交互或设备的示例包括轨迹球游戏控制器(Natapov,Castellucci,&MacKenzie,2009),智能手机触摸输入(MacKenzie,2015),桌面触摸输入(Sasangohar,MacKenzie,&Scott,2009), Wiimote枪支附件(McArthur,Castellucci,&MacKenzie,2009),眼动追踪(Zhang&MacKenzie,2007),手套输入(Calvo,Burnett,Finomore,&Perugini,2012)和唇部输入(Jose&de Deus Lopes,2015) )。对于唇输入,吞吐量值的范围从大约1位/秒到用于触摸输入的大约7位/秒。鼠标值通常在4-5位/秒范围内。

吞吐量的计算

尽管ISO 9241‐9为Fitts的吞吐量提供了正确的公式,但在数据收集、数据聚合或执行精度调整时,几乎不提供任何指导。后者在使用2D任务时带来了特殊的挑战。在本节中,我们将研究计算Fitts吞吐量的最佳实践方法。我们从图17.7开始,它显示了吞吐量的公式,扩展显示了ID的Shannon公式,以及目标振幅和目标宽度的有效值的使用。该图还强调了计算中速度(1/MT)和精度(SDx)的存在。
在这里插入图片描述
图17.7 吞吐量公式,显示了香农公式的ID和调整的准确性。速度(1/MT)和精度(SDx)的特点。
在这里插入图片描述图17.8 试验用几何图形。

无论是使用1D还是2D任务,计算吞吐量都需要每次试验的笛卡尔坐标数据。需要三个点的数据:起始位置(“from”)、目标位置(“to”)和试验结束位置(“select”)。参见图17.8。虽然图中显示了向右水平移动的试验,但是下面描述的计算对于任何方向或角度的移动都是有效的。循环目标用于提供任务的概念可视化。根据实验中的设置,其他目标形状也有可能。计算首先计算图中连接from、to和select点的边的长度。使用Java语法:

double a = Math.hypot(x1—x2, y1—y2);
double b = Math.hypot(x—x2, y—y2);
double c = Math.hypot(x1—x, y1—y);

x‐y坐标对应于图中的from (x1, y1)、to (x2, y2)和select (x, y)点。给定a, b, c,如上所示,计算dx和ae:

double dx = (c * c — b * b — a * a)/(2.0 * a);
double ae = a + dx;

注意,dx对于目标中心的一个选择为0(与任务轴上的投影一样),对于中心远端的一个选择为正值,对于近端的一个选择为负值。某些选择可能会偏离目标,这是一种预期的行为。有效目标振幅(Ae)为上述代码中的Ae。这是实际的点对点移动距离的试验,正如预测在任务轴。对于串行响应,Ae的另一个调整是添加前一个试验的dx(对于第一个试验之后的所有试验)。这是必要的,因为每个试验都是从前一个试验的选择点开始的。对于离散响应,每次试验都从目标的中心开始。
给定一系列试验中from、to和select点的数组,以及每个试验的计算ae和dx, ae是ae值的平均值,SDx是dx值的标准差。其中IDe计算公式为Eq. 17.6 (sub - Ae and We = 4.133×SDx),吞吐量(TP)计算公式为Eq. 17.3 (using IDe)。参见图17.7中的方程。当然,运动时间(MT)是序列中所有试验记录的时间的平均值。
最后一点与计算吞吐量的分析单元有关。吞吐量的cor - rect分析单元是对单个参与者进行的不间断试验序列。这样做的前提有两个:

•吞吐量不能在一次试验中计算出来;
•一系列试验是最小的行动单元,吞吐量可以作为性能的度量。

关于第一点,吞吐量的计算包括选择坐标的可变性,类似于“噪声”。因此,需要多个选择,并从收集的数据计算坐标的变异性。
第二点是生态问题。在一系列的实验之后,参与者暂停,伸展,调整仪器,喝一口茶,调整她在椅子上的位置,或者其他什么。序列之间有一个界限,除了提供一个休息或暂停,或者可能改变到一个不同的测试条件,没有特定的意图。有理由断言,一旦一个序列结束,它就结束了!行为被展示、观察和测量,下一个序列被作为一个单独的行为单元,用单独的性能测量来处理。
鉴于以上几点,有必要更仔细地研究吞吐量的计算。考虑表17.1。
表中的每一行都总结了16名参与者在指定的A和w进行的两个15‐秒序列试验的结果,每个序列的MT = 15/m,其中m为触针敲击的数量。表中MT为16个以上参与者的平均值,每个参与者有两个序列。表中ID由A和W计算,使用式17.2。每一行的吞吐量计算一次,根据该行中的值作为ID/MT。
TP的展开公式如下:
在这里插入图片描述
其中n为参与人数×序列组合,本例中为- 32。但是,正确的计算,考虑到适当的分析单元,是:
在这里插入图片描述
用式17.8计算每个试验序列的吞吐量。总吞吐量是n个值的平均值。公式17.7和式17.8对于表17.1中的数据将产生相同的值,因为ID的迭代值在参与者和序列之间是相同的。但是,当使用克罗斯曼的精度调整时,情况就不同了。如前所述,式17.7中的分子用We计算IDe。空间变异性被提炼为一个单独的值,这个值又生成一个单独的IDe。我们称之为IDe。式(17.7)为,对精度进行调整
在这里插入图片描述
从本质上讲,一系列试验中的精度分量是不同的。精度在最后作为一个单一的综合调整包括适用于所有参与者和试验序列。考虑到ID的日志项的复杂性,这种方法很可能在计算吞吐量时引入偏差。同样,考虑到analy - sis的单位,正确的吞吐量计算包括精度调整是:
在这里插入图片描述
方程17.10将每个试验序列视为一个单独的作用单元。速度和准确度结合在一起,成为衡量参与者行为(吞吐量)的单一指标。然后在参与者和试验序列之间对这些度量进行求和和平均。式17.9和式17.10将产生不同的吞吐量值。对于表17.1中的数据,使用式17.9,TP = 8.97 bits/s。这与表17.1中TP = 10.10 bits/s的值形成对比,表17.7使用了式17.7。使用式17.10不可能重新计算吞吐量,因为在每个试验序列上,Fitts的实验数据并不适用于每个参与者。综上所述,如表17.1所示,从Fitts定律实验中减少数据,对于总结参与者的反应或建立Fitts定律预测方程(见式17.4)是有用的,但如果目标是测量信息传递率(即吞吐量;见式17.3,图17.7)。因此,对于单序列试验数据,使用Eq. 17.3(如图17.7所示)计算IDe的每一个值,都应使用Eq. 17.10。这里我们再次看到了菲茨定律作为预测模型和作为测量模型的区别。让我们继续以一个使用Fitts吞吐量进行交互的示例为例,这种交互通常出现在现代计算系统中。

用户研究示例

现在,我们将上述想法整合到一个研究智能手机上基于触摸的目标选择的用户研究示例中。由于一维和二维任务类型在Fitts定律研究中都很常见,因此有必要研究一下一维任务和二维任务在吞吐量上是否存在固有的差异。似乎这个问题还没有被系统地研究过,也就是说,在一个受控的实验中,使用任务类型(1D vs. 2D)作为自变量。

参与者

参与者是从当地大学校园招募的。唯一的规定是参与者必须是触摸屏手机、平板电脑或平板电脑的常规用户。来自不同学科的16名参与者被招募。六是女性。平均年龄24.3岁(SD = 3.0)。参与者的平均触屏体验为22.9个月(SD = 15.8)。所有参与者都是右撇子。

仪器(硬件和软件)

测试设备是LG Nexus 4触摸屏智能手机,运行Android操作系统4.2.2版。显示器为61×102 mm(2.4英寸×4.0英寸),分辨率为768×1184像素,像素密度为320 dpi。在测试期间,所有与手机的通信都被禁用。
自定义Android软件FittstOuch是使用Java SDK 1.6开发的。该软件实现了一系列一维和二维任务,这些任务通常用于Fitts定律实验,并在ISO 9241‐9中规定。(FittstOuch是免费的下载包括源代码。见上文)。
两种任务类型使用相同的目标振幅和宽度条件。由于显示器和手指输入都很小,所以范围有限。总共使用了6种组合:A ={156, 312, 624}像素×W ={78, 130}像素。这与ID = 1.14位到ID = 3.17位之间的任务难度有关(见式17.6)。一个更大的范围是可取的,但试点测试显示,对较小的目标非常高的错误率。(这是由于一种被称为“胖手指问题”的触摸输入现象——wigdor, Forlines, Baudisch, Barnwell, & Shen, 2007)。目标条件的规模为选择最宽的条件(最大的A,最大的W)横跨显示器的宽度(纵向方向),每边减去10个像素。图17.9显示了目标指示的例子。
二维条件包括20个目标,这是一个序列的试验次数。选中的目标突出显示。选中后,高亮显示移动到相反的目标。选择按布局圆的旋转模式进行,直到选中所有目标。对于1D任务,来回进行选择。序列的数据收集从第一次点击开始,在20个目标之后结束选择(21)。

步骤

在签署了一份同意书后,参与者被简要介绍了此次试验的目的。实验任务被演示给参与者,然后他们做一些练习序列。他们坐在办公桌前,把设备放在桌面上。如果需要的话,他们可以用非惯用手来固定设备。展示了一个参与者在一维条件下进行试验的例子
在这里插入图片描述
图17.9任务条件示例。(a) a = 312 & W = 78的1D。(b) 2D,其中A = 156, W = 130。© 2D, A = 624, W = 78。所有单位像素。
在这里插入图片描述
图17.10 (a)在1D条件下进行试验的参与者。(b)序列末尾的示例对话框。
如图17.10所示。如果目标没有击中,就会发出一种听觉哔哔声。在每个序列的末尾出现一个对话框,显示序列的摘要结果。参见图17.10b中的示例。这个对话框对演示非常有用,可以在测试期间帮助通知和激励参与者。参与者被要求以舒适的速度,尽可能快速、准确地选择目标。他们被告知偶尔错过一个目标是可以的,但是如果错过了很多目标,他们应该放慢速度。

结果与讨论

吞吐量的总体平均值是6.85位/秒。这个结果本身就很了不起。在这里,我们看到的经验证据支持了轻蔑触摸互动的巨大成功。触摸体验不仅吸引人,触摸性能明显优于传统的交互技术。对于桌面交互,鼠标在大多数点交互任务中表现最佳。(手写笔可能是个例外。触控笔的性能一般与鼠标相当,有时甚至略好于鼠标。,1991)。在对Fitts遵循ISO 9241‐9标准进行的法律研究的回顾中,鼠标的通过置值范围从3.7位/秒到4.9位/秒(Soukoreff & MacKenzie, 2004,表5)。刚刚报告的触摸输入值显示,与鼠标相比,触摸的性能提高了40%到85%。(当然,直接比较是不可能的,因为在本研究中使用的LG Nexus 4等小型触摸屏设备上不支持鼠标输入。)最可能的原因在于直接输入与间接输入的区别。通过鼠标或其他传统的指向设备,用户可以操纵设备来间接控制屏幕上的跟踪符号。选择需要在设备上按一个按钮。触摸输入既没有跟踪符号也没有按钮:输入是直接的!参与者和任务的吞吐量结果如表17.2所示。一维任务的吞吐量为7.43位/秒,比二维任务的平均值6.27位/秒高18.5%。差异有统计学意义(F1,15 = 29.8, p < .0001)。所有参与者对一维任务的吞吐量都更高。吞吐量在五个测试块上相当平稳,从块1到块5的吞吐量变化小于3%。因此,没有按块给出结果的细目。一维条件下更高的吞吐量解释如下。只有侧移‐侧移,一维条件更容易。二维条件下的运动更为复杂,因为每次试验运动方向变化360°/20 = 18°。此外,在一些序列试验中,闭塞是不可避免的。这不会发生在1D任务中。吞吐量采用式17.3计算,采用Shannon公式对ID、Ae和We进行计算(如图17.7所示)。如前所述,计算的分析单元是一系列试验。因此,表17.2中的每个吞吐量值是30个吞吐量值的平均值,因为每个参与者对6个A‐W条件中的每一个进行了5个序列试验(每个区块1个)。图17.11显示了按任务划分的吞吐量的结果图表,可能会出现在研究论文中。使用表17.2中底部一行的值,误差条显示±1 SD。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值