【论文笔记】设计一款针对情境障碍的视力减弱型文件浏览应用程序（上）-CSDN博客

本文链接：https://blog.csdn.net/WEGST/article/details/138155751

论文关键点

ps：这篇文章可以学习的内容比较多，笔记内容也比较丰富因此本次论文笔记会分为上下期

提出的问题: 不方便视觉障碍的情况下(通勤、走路、眼睛疲劳也算)会用text-speech 系统,但是这种听觉是线性的,不适合skim

推导出了融合听觉和视觉阅读模式的“减少眼睛”略读的概念，灵感来自参与者如何混合视觉和非视觉交互，生成了一套减少眼睛的略读设计指南

对于视障情景存在的问题有比较完善的呈现

related work

SpeechSkimmer [6] 支持对录制的语音进行听觉略读，方法是根据停顿时间和非语音声音压缩停顿并构建音频结构。文字记录可作为音频内容的代理，用于视觉略读，并通过突出显示语音识别器输出中置信度高的单词来帮助发现关键词 [57, 59]。

近期的研究主要关注屏幕阅读器用户的非视觉略读。Ahmed 等人[2, 3]进行了一系列研究，通过自动总结多层次抽象文本来支持在线内容的略读。作者将他们的研究扩展到了触摸屏设备[4]，并在 VoiceOver 默认手势的基础上设计了一套新颖的手势，如捏入和捏出，以控制摘要的层次。

Machulla 等人提出了针对 VI 人士的非视觉文档略读的设计含义[35]。他们建议支持文本宏观结构（如章节标题、段落、图表）之间的导航，改变音调或添加听觉刺激以强调微观结构（如突出显示的文本、粗体或斜体字），并支持动态语速。在我们的工作中，我们证明了这些用于 VI 环境的设计理念中的一些理念可以移植到 SI 环境中。

Needs Finding for auditory skimming

设计的场景

必要的阅读任务，在时间限制中完成任务，而且尽可能不用眼睛阅读（乘车场景）

我们让被试想象自己正在参加研究生水平的课程，并在当天晚些时候有一个班级的阅读任务，他们必须参加一个同伴讨论会议。为了促进讨论，他们在乘坐公共汽车上学的同时，应该在时间限制下浏览给定的阅读材料。为了加强模拟的SI（Situational Impairment），我们要求被试尽量减少对屏幕的视觉注意，假装否则他们可能会感到恶心。看屏幕被允许发布命令，但他们被指示在倾听时尽可能地向外看。

发现的问题与对应解决的设计原则

1.Non-linear navigation is hard:

Participants were in need of non-linear navigation features that leverage the semantic structure of a document (e.g., sentences, paragraphs)
+15s -15s 的时间跳跃是不可行的
由于没有结构,一切听起来都很相似(难以区分重要程度?)

DG-1 列表跳转
目录-点击-跳转

DG-2 做一些语义和空间的navigation

使用户能够利用有意义的单词和结构标记(例如,章节、段落)作为导航线索
持话语标记语跳跃来促进略读，因为它们在视觉略读时也是重要的线索
- Interactive markers: 管理信息流，作为读者的向导，e.g ‘finally’ ‘to conclude’
- interactional markers: 传达作者对信息的观点,e.g:‘it is clear that’

DG - 7 提供听觉或触觉反馈作为非视觉导航线索
例如，可以在段落末尾和新段落开头之间进行听觉反馈，促使用户关注内容中的结构边界。

2.Listening and navigating at the same time is difficult.

听力和短时记忆正在争夺共享的认知资源（假设需要导航去找一些章节的内容的时候，如果声音还在继续播放，就会很痛苦）

DG-3 navigation的时候就停止播放

3.Some types of content are difficult to understand by listening.

(也许对于BLV来说这个问题不会那么明显)

4.Original layout better supports structural understanding

DG-6 减少书面化的语音输出,比如:

	1.把e.g转“即”
	
	2.长句分隔符
	
	3.去除叙述脚注和引文
	
	4.加入context:即将开始下一节

5.Dynamic speech rate control is needed but inaccessible.

DG-4 语速可调

6.There are individual differences in preferred reading order.

DG-10 Support individual differences in skimming strategies.

用户应该被允许预设一个自定义的阅读顺序，其中应用程序将自动访问文档元素。

7.Document formatting and article type impact comprehension.

DG-5 提供一个视觉指导符

explain:现在读到哪了(微信读书有)

DG-8. Support opt-in visual engagement.

我们的需求发现研究表明，当从主文切换到图/表字幕时，应该有选入过程的支持。此外，当系统讲述一个复杂的数字时，很难通过听力理解，系统应该在屏幕上提供放大的数字文本，以便于视觉访问。

DG-9. Support unimanual interactions.

单手操作支持

DG-11. Support annotation creation and consumption.