训练的数据采用的是观看的隐式反馈,当用户完成一个视频的观看则是正例,言外之意,其他为负例(包括没有观看的都是负例,那么对于新用户而言则都是负例了,这样是否合适??【目前来说对于没有观看记录的用户不做推荐,这个没办法,只能用其他方法来推,同样没有任何人点击的item也是没法整的,这两种冷启动这里是没办法做的】)
对应的paper中的话为:
we use the implicit feedback [16] of watches to train the model, where a user completing a video is a positive example.
为啥这个论文没有什么开源的代码?有几个github,但都没有什么star,还是论文说的不够清晰明了,很多细节问题没有说到位,google也不给个开源的版本,工程问题很多。
关于loss的问题,有几个版本均是采用的nce_loss,Noise-contrastive estimation
这个是针对非正态分布模型的估计的loss,直接翻译为噪声对比估计损失函数,鉴于工程方面的问题说教毫无意义,因此将简单复现论文,开发中的github在此:https://github.com/rcdnn/Youtube-Recommendation