>任务描述
设计一个分类器模型,基于给定的数据训练这个模型,并挖掘出用户潜在的观影兴趣,据此作出电影推荐。
最后做出相应的ROC曲线,评定这个模型。
转载请注明来源于:[CSDN]身披白袍's博客
>问题分析及解题
忽略数据格式,因为数据格式是很好处理的。
在此我们只专注于“用户”和“产品”这两种核心数据。假设有m个用户和n个产品(即电影)。
我们需要有两个矩阵,第一个矩阵A,其单元aij表示用户i选择了产品j。显然矩阵A是一个大小为m*n的矩阵。
在读入数据时,给用户编号,给产品编号,只要用户i选择了j,那么aij置为1,否则默认置0。
第二个矩阵D,其单元dij表示选了产品j的用户有可能选择产品i的兴趣度(概率、打分值),该值越大则该选择了产品j的用户越容易选择产品i。
我们称矩阵A为选择矩阵,矩阵D为打分矩阵。其中,在我设计的这个模型中,打分矩阵各元的计算公式如下: