ICDE 2023 | 多场景多任务学习在美团到店餐饮推荐的实践
背景:
· 多场景:美食关键词搜索、限时秒杀推荐、套餐推荐、商家商品推荐等。随着推荐场景数量的增加,传统地针对单个场景独立开发推荐模型有很多劣势和局限性
· 多任务:在这些场景中需要优化的指标是点击(CTR)和转化(CVR)
本文提出了一种层次化信息抽取网络(HiNet)也就是一个端到端的两层信息抽取框架,来共同建模场景间和任务间的信息共享和协作,其中包括场景抽取层(Scenario Extraction Layer)和任务抽取层(Task Extraction Layer)。
创新点:
· HiNet,用于优化多场景下的多种任务指标
· 在场景信息抽取层中,提出了场景感知注意力网络SAN模块
HINET
场景抽取层(Scenario Extraction Layer)
多场景共享,借鉴MMOE。用场景感知注意力网络(Scenario-aware Attentive Network,SAN)来衡量其他场景信息对当前场景信息表征贡献的重要性。
这一层的输出包含三个部分:
· Scenario-shared/specific Expert Network: G
· Scenario-aware Attentive Network:Ai 其他场景的加权和
· Scenario-specific expert network:Si
任务抽取层(Task Extraction Layer)
借鉴PLE,采用了自定义门控网络CGC模块
自定义门控网络主要用来控制共享专家网络和特有专家网络的权重。前者主要负责学习当前场景中所有任务中的共享信息,后者用于提取当前场景中各个任务的特有信息。
Loss
i是场景数,j是任务数,
λ
\lambda
λ是控制多个任务loss之间的权重的超参