数据挖掘算法原理与实践：基于矩阵分解的协同过滤算法

最新推荐文章于 2024-05-27 09:25:38 发布

川师_King

最新推荐文章于 2024-05-27 09:25:38 发布

阅读量4.4k

点赞数 13

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/weixin_44196785/article/details/115356828

版权

数据挖掘专栏收录该内容

11 篇文章 9 订阅

订阅专栏

第1关：基于矩阵分解的协同过滤算法

# -*- coding: utf-8 -*-
import numpy as np

def recommend(userID,lr,alpha,d,n_iter,data):
    '''
    userID(int):1-10推荐用户ID
    lr(float):学习率
    alpha(float):权重衰减系数
    d(int):矩阵分解因子(元素个数)
    n_iter(int):训练轮数
    data(ndarray):评分表
    '''
    #*********Begin*********#
    #获取用户数与物品数
    m,n = data.shape 
    #初始化喜好矩阵与内容矩阵，值为0-1之间，符合正态分布  
    x = np.random.uniform(0,1,(m,d))
    w = np.random.uniform(0,1,(d,n))
    #创建评分记录表，无评分记为0，有评分记为1
    record = np.array(data>0,dtype=int)
    #梯度下降，更新参数           
    for i in range(n_iter):
        x_grads = np.dot(np.multiply(record,np.dot(x,w)-data),w.T)
        w_grads = np.dot(x.T,np.multiply(record,np.dot(x,w)-data))
        x = alpha*x - lr*x_grads
        w = alpha*w - lr*w_grads
    #预测
    predict = np.dot(x,w)
    #将用户未使用过的物品分值从低到高进行排列
    for i in range(n):
        if record[userID-1][i] == 1 :
            predict[userID-1][i] = 0 
    recommend = np.argsort(predict[userID-1])

    #*********End*********#
    print('为用户%d,推荐的物品为：物品%d,物品%d'%(userID,recommend[-1]+1,recommend[-2]+1))

第2关：动手搭建电影推荐系统

# -*- coding: utf-8 -*-
import numpy as np
def build_rating(m,n,ratings_df):
    '''
    m(int):用户数
    n(int):电影数
    ratings_df(DataFrame):用户对电影评分记录表
    rating(ndarray):用户-电影评分矩阵
    '''
    #*********Begin*********#
    #创建电影评分矩阵
    rating = np.zeros((m,n))
    for index,row in ratings_df.iterrows():
        rating[int(row['userId']),int(row['movieRow'])]=row['rating']
    #*********End*********#
    return rating
#训练模型
def fit(lr,alpha,d,n_iter,data):
    '''
    userID(int):推荐用户ID
    lr(float):学习率
    alpha(float):权重衰减系数
    d(int):矩阵分解因子
    n_iter(int):训练轮数
    data(ndarray):用户-电影评分矩阵
    ''' 
    #*********Begin*********#
    #获取用户数与电影数
    m,n = data.shape 
    #初始化喜好矩阵与内容矩阵，值为0-1之间，符合正态分布  
    x = np.random.uniform(0,1,(m,d))
    w = np.random.uniform(0,1,(d,n))
    #创建评分记录表，无评分记为0，有评分记为1
    record = np.array(data>0,dtype=int)
    #梯度下降，更新参数           
    for i in range(n_iter):
        x_grads = np.dot(np.multiply(record,np.dot(x,w)-data),w.T)
        w_grads = np.dot(x.T,np.multiply(record,np.dot(x,w)-data))
        x = alpha*x - lr*x_grads
        w = alpha*w - lr*w_grads
    #预测
    predict = np.dot(x,w)
    #*********End*********#
    return predict
#进行推荐   
def recommend(userID,predict,data):
    '''
    userID(int):推荐用户ID
    predict(ndarray):预测结果
    data(ndarray):用户-电影评分矩阵
    '''
    #*********Begin*********#
    #将用户未看过的电影分值从低到高进行排列
    n = predict.shape[1]
    record = np.array(data>0,dtype=int)
    for i in range(n):
        if record[userID-1][i] == 1 :
            predict[userID-1][i] = 0 
    recommend = np.argsort(predict[userID-1])
    #*********End*********#
    return recommend

川师_King

关注

13
点赞
踩
50

收藏

觉得还不错? 一键收藏
1
评论
数据挖掘算法原理与实践：基于矩阵分解的协同过滤算法

第1关：基于矩阵分解的协同过滤算法# -*- coding: utf-8 -*-import numpy as npdef recommend(userID,lr,alpha,d,n_iter,data): ''' userID(int):1-10推荐用户ID lr(float):学习率 alpha(float):权重衰减系数 d(int):矩阵分解因子(元素个数) n_iter(int):训练轮数 data(ndarray):评分表
复制链接

扫一扫

专栏目录