信息检索中的匹配

最新推荐文章于 2023-01-12 21:46:05 发布

zhimin魏魏魏

最新推荐文章于 2023-01-12 21:46:05 发布

阅读量964

点赞数

分类专栏： solr

原文链接：https://blog.csdn.net/xixiaoyaoww/article/details/105460175

版权

solr 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

信息检索中的匹配
除上述4个场景之外，还有query-title匹配、query-document匹配等信息检索场景下的文本匹配问题。不过，信息检索场景下，一般先通过检索方法召回相关项，再对相关项进行rerank。对这类问题来说，更重要的是ranking，而不是非黑即白或单纯的selection。ranking问题就不能仅仅依赖文本这一个维度的feature了，而且相对来说判断两个文本的语义匹配的有多深以及关系有多微妙就没那么重要了。
从纯文本维度上来说，q-a、q-r匹配和NLI相关的方法在理论上当然可以套用在query-title问题上；而query-doc问题则更多的是一个检索问题了，传统的检索模型如TFIDF、BM25等虽然是词项（term）level的文本匹配，但是配合下查询扩展，大部分case下已经可以取得看起来不错的效果了。如果非要考虑语义层次的匹配，也可以使用LSA、LDA等主题模型的传统方法。当然啦，强行上深度学习方法也是没问题的，例如做一下query理解，甚至直接进行query-doc的匹配（只要你舍得砸资源部署），相关工作如

DSSM：CIKM2013 | Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

CDSSM：WWW2014 | Learning Semantic Representations Using Convolutional Neural Networks for Web Search

HCAN：EMNLP2019 | Bridging the Gap between Relevance Matching and Semantic Matching for Short Text Similarity Modeling

原文链接：https://blog.csdn.net/xixiaoyaoww/article/details/105460175