kaggle-电影评分预测从零开始

记录从什么都不会开始的kaggle之旅
电影推荐评分数据链接

处理数据思路:

  1. 使用矩阵分解的思路,将数据转换成矩阵处理
  2. 使用python提供的pandas进行处理

首先,使用思路1将training_ratings_for_kaggle_comp.csv转换成矩阵。
python-稀疏矩阵
python读取csv某一列、行的方式
注意易出错的细节:在读取文件的路径前加 r

#将csv形式的数据转换成矩阵
import csv

#读取
with open(r'E:\LP\Kaggle\Movie Recommendation\training_ratings_for_kaggle_comp.csv') as f:
    f_csv = csv.reader(f)
    userid = [row[0] for row in f_csv]

with open(r'E:\LP\Kaggle\Movie Recommendation\training_ratings_for_kaggle_comp.csv') as f:
    f_csv = csv.reader(f)   
    movieid = [row[1] for row in f_csv]

with open(r'E:\LP\Kaggle\Movie Recommendation\training_ratings_for_kaggle_comp.csv') as f:
    f_csv = csv.reader(f)
    rating = [row[2] for row in f_csv]  

training_ratings_for_kaggle_comp.csv的数据转换成稀疏矩阵形式

#去掉header
row_userid = userid[1:]   
col_movieid = movieid[1:]
data_rating = rating[1:]

#print row_userid[:20]
#print col_movieid[:20]
#print data_rating[:20]

R = sparse.coo_matrix((data_rating,(row_userid,col_movieid)),dtype=int)
print R.todense()
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值