Movielens数据集 -用户物品评分矩阵转化
#代码实现
// An highlighted block
file = open("ratings.csv", 'r',
encoding='UTF-8') # 记得读取文件时加‘r’, encoding='UTF-8'
# 读取data.csv中每行中除了名字的数据
data = {} # # 存放每位用户评论的电影和评分
for line in file.readlines()[1:100000]:
# 注意这里不是readline()
line = line.strip().split(',')
# 如果字典中没有某位用户,则使用用户ID来创建这位用户
if not line[0] in data.keys():
data[line[0]] = {line[1]: line[2]}
# 否则直接添加以该用户ID为key字典中
else:
data[line[0]][line[1]] = line[2]
df = pandas.DataFrame(data).T.fillna(0)
print(df)
#结果