- 博客(1)
- 收藏
- 关注
原创 小红书搜索引擎介绍
王树森博士以小红书的社区搜索为例,讲解搜索引擎的入门知识,包括搜索引擎的三个主要环节——查询词处理(QP)、召回(Retrieval)、排序(Ranking)——以及它们背后的机器学习、自然语言处理技术。(1)相关性:工业界的做法是人工标注query与笔记的相关度,高、中高、中低、低,至少标注几十万的二元组,训练机器学习模型;(2)内容质量:作者EAT(人工作者的专业性、权威性、可信赖性)、笔记意图(有益、有害)、内容质量分。包括主通道的文本召回(倒排索引+召回规则)和旁路通道的向量召回(双塔模型)
2023-03-02 14:36:47 1239 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人