背景
在过去的二十年里,口语内容分析已经成为语音处理界一个颇具吸引力的新兴研究课题,因为与口语文档相关的大量多媒体数据向公众开放。关于处理给定的文本/口头查询和口头文档,有两个主要的研究流派。
STD和SDR的区别
On one hand, spoken term detection [1, 2] embraces the goal of extracting probable spoken terms or phrases inherent in a spoken document that could match the query words or phrases literally. On the other hand, spoken document retrieval (SDR) [1, 6] revolves more around the notion of relevance of a spoken document in response to the query.
一方面,口头词语检测(STD) 提取口头文档中字面上可能与查询词语或短语匹配的固有的目标。另一方面,口语文档检索(SDR) 更多地围绕响应查询的口语文档的相关性这一概念。人们普遍认为,如果一个文档能够满足查询规定的信息需求,那么它就是相关的,而不是因为它恰好包含给定查询中的所有单词[4,5]。
References
[1] M. Larson and G. J. F. Jones, “Spoken content retrieval: a survey of techniques and technologies