每天一篇阅读文献/ Day 2/ 2021.8.11

最新推荐文章于 2023-02-06 09:16:52 发布

最爱喝酸奶的小高

最新推荐文章于 2023-02-06 09:16:52 发布

阅读量157

点赞数

分类专栏：韵律和意图理解

本文链接：https://blog.csdn.net/weixin_43420659/article/details/119620046

版权

韵律和意图理解专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文献引用：Hellbernd, N., & Sammler, D. (2016). Prosody conveys speaker’s intentions: Acoustic cues for speech act perception. Journal of Memory and Language, 88, 70-86.

实验逻辑

行动理论的语言观点认为，对他人意图的识别是人际交流成功的关键。然而，说话者并不总是按字面意思编码他们的意图。本研究调查了韵律是否以及如何有助于识别“未说出口”的意图。

通过判别分析的方式对说话者言语行为的声音表达进行分析(实验1)。如果说话者的意图能够在韵律特征中被编码，应该可以根据说话者的声学特性对言语行为的不同类别进行分类（包括词和非词）。
实验2考察了听者是否能够仅根据韵律模式识别正确意图，即依据6个选项的强制选择(6-AFC)分类任务以及每一个言语行为量表刺激强度的评级(e.g., ‘‘How much does it sound like criticism?”) 。如果韵律以一种部分常规化的方式表达意义，听众应该能在缺乏语境的情况下区分意图(i.e., in single words)，且不考虑词汇意义 (i.e., similarly in words and non-words).
最后，确定哪些韵律的声学参数对各自意图的感知贡献最大(实验3)。因此，我们将声学参数输入多重线性回归分析中以预测听者在每种言语行为量表上的评分。此外，为了控制情绪对意图识别可能的影响，在回归出效价和唤醒等级后，再次进行回归分析。

实验一（acoustics）

1. 研究目的

考察说话者是否使用特征声学特征来传达他们的意图。
在本研究中，四名说话者用不同的韵律产生单字刺激来表达六种不同的意图，即批评、怀疑、命名、暗示、警告和希望。

2.材料和方法

2.1 刺激录音

四名训练有素的母语为德语的人被邀请录制德语单词Bier(啤酒)和Bar (Bar)以及非词Diem和Dahm(见附录)。这些(非)词被用来表达六种不同的交际意图或言语行为: 批评、怀疑、命名、建议、警告和愿望。

2.2 声学特征

主要关注7种声学特征：stimulus duration, mean intensity, harmonics-to-noise ratio (HNR), mean fundamental frequency (f0) as well as pitch rise(the difference between offset and onset f0), spectral center of gravity and the standard deviation of the spectrum

2.3 判别性分析

7个声学特征为自变量，以言语行为类别(批评、怀疑等)为因变量。

3. 结果

3.1

在这里插入图片描述
判别分析对92%的词刺激和93%的非词刺激进行了正确的言语行为分类。The highest results were found for naming and warning (both 100% correct classification for words and non-words), while the lowest results were obtained for criticism in words (76.6% correct classification), and non-words (79.7%)

3.2

在这里插入图片描述
用前两个判别函数对不同的言语行为进行分类。

第一个函数(x轴)解释了49.6%的词的方差和54.2%的非词的方差，主要是基于**pitch rise (offset– onset f0)**的声学测量。

第二判别函数(y轴)对单词有38.6%的额外判别能力，对非单词有36.4%的额外判别能力，它与刺激的 mean intensity and mean f0 最相关；

第三个函数(没有在图1)解释了10.5%的词汇方差和7.7%的非词汇方差，并显示出与刺激duration的最高相关性。

4. 讨论

刺激的声学特征可以用来准确地分类正确的言语行为，无论是单词还是非单词。这表明在言语行为类别中，说话人有意使用韵律模式来编码其意图的独特性，以及韵律与词汇内容的相对独立性。

实验二（behavior）

1. 研究目的

在发现韵律言语行为表达之间一致的声学差异后，研究者对参与者对刺激的感知感兴趣。在6-AFC分类任务中（6-alternative forced-choice (6-AFC) categorization task.），她们考察了被试是否能够基于韵律信息识别不同的意图。参与者进一步判断每个刺激的效价和唤醒，这让我们能够评估，在多大程度上，言语行为可以根据他们的情绪基调来分类。

2. 材料和方法

2.1 被试

10名被试（6名女性）进行真词任务，10名进行非词任务（4名女性）。对不同组的参与者进行词汇和非词汇测试，以避免将语义意义转移到非词汇刺激上。

2.2 实验步骤

实验的前半部分，被试被要求将每种刺激分配到六个可能的言语行为类别(批评、怀疑、命名、建议、警告或希望)中的一个。在阅读了不同言语行为的简短定义(附录B)后，他们通过耳机听每种声音刺激一次，并被指示按键盘上的键1-6。在整个实验过程中，计算机屏幕上都显示了相应数字的言语行为标签。回复的正确性没有反馈，也没有时间限制。

在实验的后半段，参与者被要求评估每个刺激的效价和唤醒。因此，他们按照同样的顺序再听了一遍同样的刺激。在每个声音之后，他们会在屏幕上看到两个视觉模拟尺度，第一个是效价(积极/消极)，然后是兴奋(平静/兴奋)，然后用一个连续的滑块给他们打分。

3. 结果

3.1

在这里插入图片描述
参与者能够识别刺激的正确言语行为类别，词汇和非词汇的准确率都很高 words (mean ± SD: 82 ± 13%) and for non-words (73 ± 17%)。
单词和非单词的分析如表所示。与声学分析一样，在六个言语行为类别中，识别批评的正确率是最低的。

3.2

在这里插入图片描述
在情绪知觉方面，言语行为类别的效价和唤醒度平均评分存在显著差异，在每个言语行为类别中，词语和非词语的结果非常相似(上图)。在效价量表上，警告和批评的言语行为被认为是最消极的，而希望和建议的效价更积极。根据效价，怀疑和命名被评为中性。被唤醒的说话者的知觉在命名、希望和怀疑时非常平静，在警告和批评时非常兴奋。表达建议刺激的兴奋程度在中等范围。

2.4 讨论

6-AFC分类任务的显著结果表明，参与者能够很好地从韵律本身识别说话人的交际意图。重要的是，参与者能够在没有词汇内容的情况下利用韵律信号(见下文)。这些数据表明，韵律是一种强有力的交际渠道，听者利用它来解码说话人的隐含意思和意图，并可能决定他们各自的会话反应。
效价和唤醒评级揭示了不同言语行为类别的不同情感特征，这些特征在词与非词之间是一致的(图2)。这表明说话人的意图可能具有情感内涵，听者可以从韵律信号中察觉到。
一个很自然的问题是，在韵律中对意图的识别多大程度上依赖于情感识别，以及是否可以在不考虑情感的情况下识别意图。我们在实验3中解决了这个问题

实验三（behavior and acoustics）

1. 研究目的

实验1和实验2表明，在6-AFC任务中，韵律编码意图可以被区分为（i）物理上基于特征声学特征配置和（ii）感知上基于特征声学特征配置。声学差异在多大程度上解释了参与者识别说话者意图的能力，这是有待证明。
如果参与者使用韵律的声学信息来理解意图，那么就有可能通过声学测量来预测听者的感知，进而识别引起特定言语行为印象的不同特征组合。我们通过将声学测量和每一个言语行为的典型性评级输入多元回归分析来解决这个问题。此外，为了评估情绪感知对意图识别的影响(见实验2)，我们进行了另外的回归分析，其中效价和唤醒评级被回归。

2. 材料和方法

2.1 被试

20名被试做真词，20名被试做非词

2.2 实验步骤

参与者被要求指出每种刺激听起来在多大程度上像一个给定的言语行为类别(批评、怀疑、命名、建议、警告或希望)。与6-AFC分类任务相比，这种言语行为评分为被试的知觉提供了一种更精细、更少策略依赖的测量方法，并允许应用多元回归分析。
Responses were given with a slider on a visual analogue scale from 0 to 100 (‘intonation does not fit the intention at all’ to ‘intonation fits the intention very well’)。

3. 结果

在这里插入图片描述

4. 讨论

当前的实验通过多元回归分析证实了声学和言语行为刺激感知之间的联系，其中独特的声学特征配置显著(但不完全)预测了听者对言语行为的感知。
总体而言，音高特征(mean pitch and offset–onset f0)对不同意图感知的影响最大。进一步的重要线索可以从intensity and duration的测量中得到，而spectral features对意图预测的贡献最小。

重要的是，对意图的感知并不仅仅基于对说话者情绪的识别，考虑了刺激的效价和唤醒。正如引言中提到的，我们不排除交际意图部分基于讲话者的情感状态。事实上，听者可以根据效价和唤醒对刺激进行分类。尽管如此,在这些情感成分影响已经消失后，回归分析仍然解释大量的方差的言语行为评级和言语行为预测大多数是几乎不变(表4)。只有警告（warning）和命名(naming)显示相当大的减少预测率总而言之,虽然情感也许对于一些言语行为的识别是重要的，但我们的结果给没有理由假设情感系统影响了交际意图的识别。

总讨论与未来展望

1. 总体讨论与结论

语言的行动理论观点认为说话人意图是人际交往的核心和驱动因素。然而，说话人很少在话语的命题内容中逐字地表达他们的意图，这就提出了一个问题: 说话人的意思是如何从发送者传递到接收者的。在这里，我们从言语行为的角度将意图概念化，并提供证据证明韵律是一种非言语表达意图的语言外渠道。
声学上，说话者对不同的言语行为使用不同的韵律特征结构。从行为上讲，即使没有语义意义(非词语)或情景语境(单个词语)，听者也能很好地从语音语调中区分这些意图。此外，声学和感知之间的直接联系也被证明了，即使当刺激的情感内涵被控制时，声学特征也可靠地(尽管不完全)解释了听者对刺激的感知。
总的来说，我们的结果在实验和参与者组之间的一致性有力地支持了韵律在传达交际意图方面的相关性。

2. 未来展望

2.1

未来的研究可以通过使用更广泛的记录来帮助概括我们的结果，包括句子水平的刺激，更多可变符号(如更多单词/句子)，更多的言语行为和更多的说话者。

2.2

韵律和其他辅助语言线索(如面部表情)在传达交际意图时时如何在认知上相互联系的。即韵律和面部线索在说话人的意义转换中是否融合以及如何融合，目前尚不清楚，是一个值得深入研究的课题。

2.3

从韵律理解说话人的意图依赖于听觉-韵律和其他社会认知过程的加权贡献，这些过程的确切性质和相互作用的方式仍然需要澄清。

最爱喝酸奶的小高

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
每天一篇阅读文献/ Day 2/ 2021.8.11

文献引用：Hellbernd, N., & Sammler, D. (2016). Prosody conveys speaker’s intentions: Acoustic cues for speech act perception. Journal of Memory and Language, 88, 70-86.实验逻辑行动理论的语言观点认为，对他人意图的识别是人际交流成功的关键。然而，说话者并不总是按字面意思编码他们的意图。本研究调查了韵律是否以及如何有助于识别“未说出口”的意图。
复制链接

扫一扫