语音领域区分Spoken Term Detection和Spoken Document Retrieval

最新推荐文章于 2021-08-08 22:20:22 发布

In.Z

最新推荐文章于 2021-08-08 22:20:22 发布

阅读量283

点赞数

分类专栏：日常科研文章标签：语音识别信息检索

本文链接：https://blog.csdn.net/weixin_38638559/article/details/116277674

版权

在语音处理领域，Spoken Term Detection (STD) 和 Spoken Document Retrieval (SDR) 是两个主要的研究方向。STD侧重于从口语文档中找出与查询词匹配的表达，而SDR关注的是文档与查询的关联性，即文档是否满足信息需求。

摘要由CSDN通过智能技术生成

背景

在过去的二十年里，口语内容分析已经成为语音处理界一个颇具吸引力的新兴研究课题，因为与口语文档相关的大量多媒体数据向公众开放。关于处理给定的文本/口头查询和口头文档，有两个主要的研究流派。

STD和SDR的区别

On one hand, spoken term detection [1, 2] embraces the goal of extracting probable spoken terms or phrases inherent in a spoken document that could match the query words or phrases literally. On the other hand, spoken document retrieval (SDR) [1, 6] revolves more around the notion of relevance of a spoken document in response to the query.

一方面，口头词语检测(STD) 提取口头文档中字面上可能与查询词语或短语匹配的固有的目标。另一方面，口语文档检索(SDR) 更多地围绕响应查询的口语文档的相关性这一概念。人们普遍认为，如果一个文档能够满足查询规定的信息需求，那么它就是相关的，而不是因为它恰好包含给定查询中的所有单词[4，5]。