BaselineOnly(ALS、SGD优化)与SlopeOne对MovieLens数据集进行评分预测

前言

MovieLens数据集记录了用户对电影的评分,如何通过这个数据集来给用户推荐他是否喜欢的电影。这个时候可以通过BaselineOnly或者SlopeOne算法来预测一个用户对电影的喜欢的分数,然后根据分数来决定是否推荐。

案例代码

(最近时间精力有限,具体代码注释过程见gitee):
BaselineOnly(ALS、SGD优化)对MovieLens数据集进行评分预测
SlopeOne对MovieLens数据集进行评分预测

总结

(如果您发现我写的有错误,欢迎在评论区批评指正)。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
首先,我们需要读取 `my.csv` 文件并将数据转换为用户-物品评分矩阵 `R`,其中 `R[i, j]` 表示用户 `i` 对物品 `j` 的评分。假设文件中包含 `n_users` 个用户和 `n_items` 个物品,则可以使用以下代码: ```python import numpy as np # Load data from CSV file. data = np.loadtxt('my.csv', delimiter=',') user_ids = data[:, 0].astype(int) - 1 item_ids = data[:, 1].astype(int) - 1 ratings = data[:, 2] # Create user-item rating matrix. n_users = np.max(user_ids) + 1 n_items = np.max(item_ids) + 1 R = np.zeros((n_users, n_items)) for i in range(len(user_ids)): R[user_ids[i], item_ids[i]] = ratings[i] ``` 接下来,我们可以使用上面的 `als` 函数来训练模型并计算RMSE: ```python # Split data into training and test sets. np.random.seed(123) mask = np.random.rand(len(ratings)) < 0.8 R_train = np.zeros((n_users, n_items)) R_test = np.zeros((n_users, n_items)) R_train[user_ids[mask], item_ids[mask]] = ratings[mask] R_test[user_ids[~mask], item_ids[~mask]] = ratings[~mask] # Train model using ALS algorithm. K = 10 max_iter = 10 lambda_ = 0.1 U, V = als(R_train, K, max_iter, lambda_) # Predict ratings for test set. R_pred = np.dot(U, V.T) R_pred[R_train > 0] = 0 # Compute RMSE. mse = np.sum((R_pred - R_test) ** 2) / np.sum(R_test > 0) rmse = np.sqrt(mse) print('RMSE:', rmse) ``` 上面的代码将数据集分成了训练集和测试集,使用训练集训练了模型,然后使用测试集计算了 RMSE。你可以根据需要调整参数 `K`、`max_iter` 和 `lambda_`,以获得更好的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值