16.2 Content Based Recommendations
基于内容的推荐是一只所有电影的特征值,图中 x(i) 电影i的特征向量,表示第i个电影中每个特征在电影中占的比重。 θ(j) 用户的parameter vector,表示用户对各个种类(特征)电影的喜爱程度。基于内容的推荐就是已知各个内容的特征,已知用户对部分电影的评分,求出 θ(j) ,从而预测用户对未看电影的评分。达到推荐的目的。
r(i:j)=1表示用户j对电影i进行了评分。
y(i:j) 用户j对电影i的评分是多少。
还有一种情况是已知 θ(j) ,预测电影的 x(i) 。
协同过滤指的是根据已有数据同时预测未知的 θ(j) , x(i) ,而不是对原始数据进行两种优化的反复迭代。
协同过滤算法的步骤
向量化
通过判断两者之间的距离,可以确定相关的电影。
对于所有值都缺失的用户,可以用均值来填充。