数据导论实验一

from lenskit.datasets import ML100K
from lenskit import batch, topn, util
from lenskit import crossfold as xf
from lenskit.algorithms import Recommender, als, item_knn as knn
from lenskit import topn
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
ratings = pd.read_csv("F://ml-latest-small//ratings.csv")
ratings = ratings.rename(columns={'userId': 'user', 'movieId': 'item'})
print(ratings.shape)
ratings.head()

实验结果:读取数据

movies = pd.read_csv('F://ml-latest-small//movies.csv')
movies = movies.rename(columns={'movieId': 'items'})
print(movies.shape)
print('\n'+ movies.head().to_string())

movie_ratings = ratings.groupby('item')['rating'].agg(['mean', 'count']) \
    .rename(columns = {'mean' : 'rating_mean', 'count' : 'rating_count'})
movie_ratings['items'] = movie_ratings.index
movie_ratings.head()

在这里插入图片描述

movie_ratings = pd.merge(movie_ratings, movies, on = 'items')
print(movie_ratings.head().to_string())

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值