数据导论实验一

最新推荐文章于 2024-07-18 16:51:40 发布

小晨爱学习

最新推荐文章于 2024-07-18 16:51:40 发布

阅读量488

点赞数

文章标签：机器学习 python 数据挖掘

本文链接：https://blog.csdn.net/qq_44798869/article/details/122424262

版权

from lenskit.datasets import ML100K
from lenskit import batch, topn, util
from lenskit import crossfold as xf
from lenskit.algorithms import Recommender, als, item_knn as knn
from lenskit import topn
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
ratings = pd.read_csv("F://ml-latest-small//ratings.csv")
ratings = ratings.rename(columns={'userId': 'user', 'movieId': 'item'})
print(ratings.shape)
ratings.head()

实验结果：读取数据

movies = pd.read_csv('F://ml-latest-small//movies.csv')
movies = movies.rename(columns={'movieId': 'items'})
print(movies.shape)
print('\n'+ movies.head().to_string())

movie_ratings = ratings.groupby('item')['rating'].agg(['mean', 'count']) \
    .rename(columns = {'mean' : 'rating_mean', 'count' : 'rating_count'})
movie_ratings['items'] = movie_ratings.index
movie_ratings.head()

在这里插入图片描述

movie_ratings = pd.merge(movie_ratings, movies, on = 'items')
print(movie_ratings.head().to_string())

在这里插入图片描述

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小晨爱学习

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据导论实验一

from lenskit.datasets import ML100Kfrom lenskit import batch, topn, utilfrom lenskit import crossfold as xffrom lenskit.algorithms import Recommender, als, item_knn as knnfrom lenskit import topnimport pandas as pdimport matplotlib.pyplot as pltimpo
复制链接

扫一扫