Movielens数据集 -用户物品评分矩阵

最新推荐文章于 2023-10-10 11:16:08 发布

TankOStao

最新推荐文章于 2023-10-10 11:16:08 发布

阅读量3k

点赞数

分类专栏：推荐系统

本文链接：https://blog.csdn.net/qq_36968562/article/details/105242742

版权

推荐系统专栏收录该内容

1 篇文章

订阅专栏

本文介绍如何将Movielens数据集中的用户物品评分数据转化为评分矩阵，通过Python代码实现，从CSV文件读取数据并构造用户-物品评分字典，最终转化为DataFrame格式并填充缺失值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Movielens数据集 -用户物品评分矩阵转化

去[博客设置](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9tcC5jc2RuLm5ldC9jb25zb2xlL2NvbmZpZ0Jsb2c?x-oss-process=image/format,png)页面，选择一款你喜欢的代码片高亮样式，下面展示同样高亮的 .

#代码实现

// An highlighted block
file = open("ratings.csv", 'r',
            encoding='UTF-8')  # 记得读取文件时加‘r’， encoding='UTF-8'
# 读取data.csv中每行中除了名字的数据
data = {}  # # 存放每位用户评论的电影和评分
for line in file.readlines()[1:100000]:
    # 注意这里不是readline()
    line = line.strip().split(',')
    # 如果字典中没有某位用户，则使用用户ID来创建这位用户
    if not line[0] in data.keys():
        data[line[0]] = {line[1]: line[2]}
    # 否则直接添加以该用户ID为key字典中
    else:
        data[line[0]][line[1]] = line[2]

df = pandas.DataFrame(data).T.fillna(0)
print(df)

#结果

在这里插入图片描述