二面 MAP(最大后验概率)和似然函数有什么关系?什么情况下,MAP的损失函数可以用NMSE来计算?(高斯噪声)手写Multi-head AttentionAttention的复杂度是多少?AUC是什么?推荐算法了解哪些?协同过滤的概念是什么?如果是一种普适性很强的物品(如:新华字典),怎么设计指标对它降权?AUC怎么推广到非二分类问题?怎么快速计算AUC?