1.问题引入
2.问题分析
根据矩阵分解的思想解决问题,矩阵R(5,4)可以近似表示为P和Q的乘积,即R(5,4)≈P(n,k)*Q(k,m)。
矩阵P(n,k)表示的是n个user和K个特征量之间的关系矩阵,矩阵Q(m,k)表示的是m个item和K个特征量之间的关系矩阵。
这K个特征量是一个中间变量,矩阵Q(m,k)的转置是矩阵Q(k,m),这里的K是由自己控制的,为求得R(n,m)的近似值就必须求得矩阵P和矩阵Q
3.解决方法
3.1求损失函数
损失函数(loss function)或代价函数(cost function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在本题中使用原始矩阵 R n ∗ m R_{n*m} Rn∗m与重新构建的评分矩阵 R ^ n ∗ m \hat{R}_{n*m} R^n∗m之间的误差的平方作为损失函数,则损失函数为
e i j 2 e^2_{ij} eij2= ( r i j − r i j ^ ) 2 (r_{ij}-\hat{r_{ij}})^2 (rij−rij^)