电影、广告、音乐、购物网站会有数以百万项内容,这时要计算很多很多次Xm->Vm的网络,显然是不可行的。
许多尺度损失推荐系统的实现有以下两步:检索和排序。
第一步:检索
生成一个较大的可能项的列表,例如电影推荐,可以找到用户最近看过的十部电影,然后找到十部最相似的电影,对于看的最多的三类找到十部最好的电影,再加上这个国家最受欢迎的前二十部电影,这样大概得到一个有数百个电影的列表。然后检索,删除已经看过的或者买过的东西。这个过程中得到的电影可以是用户完全不喜欢的,关键在于要涵盖一个较大的面。
第二步:排序
把向量放到神经网络中,计算predictions,然后排序。
检索步骤如果检索的量增大的话会导致更好的推荐效果但是会慢。可以做离线实验看看检索额外项的影响。