一、前言
在开始之前我们先引入例题,User表示用户,Data表示不同物品所获得的打分分数,请补全该表格
在打分表格中,用户并不见得会对所有项目都进行打分(0表示未打分),那么如何预测并补全打分表格呢,我们引入矩阵分解的概念。
为了变量名的统一,此处我采用吴恩达机器学习中的符号表示,用m表示用户数量的多少,具体表示为m行;n表示待打分物品数量的多少,具体表示为n列。在本例中m=5,n=5。
二、矩阵分解。
首先我们需要知道,在矩阵乘法的过程中,
也就意味着我们的打分表格,可以被分解为两个表格甚至多个表格,这些被分解的表格受到某些特征的共同作用,这种特征可以有多个,我们定义为K个。本例中我们取 矩阵表示m个User和K个特征之间的关系矩阵,矩阵