语音领域 区分Spoken Term Detection和Spoken Document Retrieval

在语音处理领域,Spoken Term Detection (STD) 和 Spoken Document Retrieval (SDR) 是两个主要的研究方向。STD侧重于从口语文档中找出与查询词匹配的表达,而SDR关注的是文档与查询的关联性,即文档是否满足信息需求。
摘要由CSDN通过智能技术生成

背景

在过去的二十年里,口语内容分析已经成为语音处理界一个颇具吸引力的新兴研究课题,因为与口语文档相关的大量多媒体数据向公众开放。关于处理给定的文本/口头查询和口头文档,有两个主要的研究流派。

STD和SDR的区别

On one hand, spoken term detection [1, 2] embraces the goal of extracting probable spoken terms or phrases inherent in a spoken document that could match the query words or phrases literally. On the other hand, spoken document retrieval (SDR) [1, 6] revolves more around the notion of relevance of a spoken document in response to the query.

一方面,口头词语检测(STD) 提取口头文档中字面上可能与查询词语或短语匹配的固有的目标。另一方面,口语文档检索(SDR) 更多地围绕响应查询的口语文档的相关性这一概念。人们普遍认为,如果一个文档能够满足查询规定的信息需求,那么它就是相关的,而不是因为它恰好包含给定查询中的所有单词[4,5]。

References

[1] M. Larson and G. J. F. Jones, “Spoken content retrieval: a survey of techniques and technologies

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值