1.快手重排
好多序列的引入:
- 每条的播放完成度很高
- 整个序列的正向交互程度很高
- 高粘性,有持续动作
- 能够在内容上序贯属性
(1)序列重排架构
A.序列重排整体结构采用generator-evaluator范式
B.generator从top50中生成模式丰富的序列类型
序列生成:beam search、多队列权重、多样性召回
C.evaluator 评价召回的序列整体价值
(2)多内容混排
混排定义及base方案:
混排演进过程:
混排listwise方案:
混排RL方案:
(3)端上重排整体框架:
- 端上模型推理服务
- 端上策略库
- 特征管理服务
- 离线日志及训练
云端混合模型:
edge模型部分:
端上模型效果:
2.多模态内容理解技术在搜索中的应用
(1)理解体系:
(2)图文理解:
(3)结构理解:
(4)图搜:细粒度向量化
检索任务适配:
召回差异:
图文匹配:
多模态质量评价:
预训练:
(5)文档邻域权威性识别
Query-Doc领域权威性
二阶段训练:
(6)多模态重复识别
搜索场景的大规模数据重复控制: