Python实现根据评论评分信息预测 (协同过滤,LFM,词向量)
一.数据集train.dat共393366项,第一维是用户的代号,第二维是商品代号,第三项是用户对该商品的评分,第四项是评论数,第五项是评论内容。 test.dat第一维是用户代号,第二维是商品代号。 二.简单思路及实现过程这里简单先贴出代码实现,后期再慢慢补上具体过程说明~1.数据预处理去除部分无关常用词,这里调用nltk包,将评论词词词根化等,进行...
原创
2018-06-28 01:17:54 ·
4742 阅读 ·
4 评论