分级加权打分算法 java_基于用户的协同过滤推荐算法实现原理及实现代码

最新推荐文章于 2024-04-12 06:36:29 发布

weixin_39588432

最新推荐文章于 2024-04-12 06:36:29 发布

阅读量1.2k

点赞数

文章标签：分级加权打分算法 java 分级加权评分算法 java

基于用户的协同过滤推荐算法

实现原理及实现代码

基于用户的协同过滤推荐算法实现原理

传统的基于用户（User-Based）的协同过滤推荐算法实现原理分四个步骤：

1、根据用户历史行为信息构建用户-项目评分矩阵，用户历史行为信息包括项目评分、浏览历史、收藏历史、喜好标签等，本文以单一的项目评分为例，后期介绍其他行为信息和混合行为信息，用户-项目评分矩阵如表1所示：

项目1

项目2

项目3

用户A

用户B

用户C

表1 用户-项目评分矩阵

注：用户A对项目1的评分是1分，用户A对项目2没有评分。

2、根据用户-项目评分矩阵计算用户之间的相似度。计算相似度常用的方法有余弦算法、修正余弦算法、皮尔森算法等等（后期我们会将相似度算法展开讲解，这里以余弦算法为例）。余弦算法公式如图1所示：

图1 余弦算法公式

注：表示用户u的评分集合（也就是矩阵中的一行评分数据），表示用户v的评分集合，i表示项目，表示用户u对项目1的评分乘以用户v对项目1的评分加上用户u对项目2的评分乘以用户v对项目2的评分……先相加再相乘直到最后一个项目，表示用户u对项目1的评分的平方加上用户u对项目2的评分的平方加上……先平方再相加直到最后一个项目然后得到的值取平方根，平方根乘以用户v的平方根。

3、根据用户之间的相似度得到目标用户的最近邻居KNN。KNN的筛选常用的有两种方式，一种是设置相似度阀值（给定一个相似度的下限，大于下限的相似度为最近邻居），一种是根据与目标用户相似度的高低来选择前N个最近邻居（本次以前N个为例，后期会详细对比讲解两者）。相似度排序可用经典冒泡排序法。

4、预测项目评分并进行推荐。最常用的预测公式如图2所示：

图2 预测评分公式

注：该公式实际上是相似度和评分的加权平均数。表示用户u对项目i的预测评分，n是最近邻集合，v是任意一个最近邻居，表示最近邻v和目标用户u的相似度乘以最近邻v对项目i的评分。得到预测评分后按照评分高低进行降序推荐。

5、结论。以上步骤是最简单，最传统的基于用户的协同过滤推荐算法的实现原理，但是在实现过程中还是有很多注意细节。

基于用户的协同过滤推荐算法实现代码

本文我们介绍两种实现代码，都是java语言开发，单机版（本地测试），数据集使用movielens的ml-100k，943*1682，80000条数据。

第一种，自定义实现：

1、项目目录，如图3所示：

图3 项目目录

2、Application.java文件，算法主运行方法

import java.util.Arrays;

import java.util.HashMap;

import java.util.Map;

import java.util.Scanner;

import java.util.Set;

/**

* 协同过滤推荐算法运行主方法

* @author line

public class Application implements Base {

public static void main(String[] args) {

// 输入userId，并获取

System.out.println("请输入一个用户Id（1、2、3……943）");

Scanner scanner = new Scanner(http://System.in);

//获取得到输入的userId

int userId = scanner.nextInt();

// 从文件中读取数据

int[][] user_movie_base = new int[PREFROWCOUNT][COLUMNCOUNT];

//读取文件中的数据

user_movie_base = new ReadFile().readFile(BASE);

//产生相似度矩阵

double[] similarityMatrix = new ProduceSimilarityMatrix().produceSimilarityMatrix(user_movie_base, userId);

// 知道每个用户之间的相似度值之后，开始获取每隔相似值对应的userId，然后和相似值关联，再根据相似值排序，即得到相似爱好的userId，然后再输出相似推荐的商品

int[] id = new int[KNEIGHBOUR];//存放K个最近邻userId

//产生一个临时相似度矩阵变量，是为了相似度排序时和userid对应

double[] tempSimilarity = new double[similarityMatrix.length];

for (int j = 0; j < tempSimilarity.length; j++) {

tempSimilarity[j] = similarityMatrix[j];

}

Arrays.sort(tempSimilarity);//排序，升序

int flag = 0;//临时变量

double[] similarity = new double[KNEIGHBOUR];//保存前K个相似度，从大到小

for (int m = tempSimilarity.length - 1; m >= tempSimilarity.length - KNEIGHBOUR; m--) {

for(int j = 0; j < similarityMatrix.length; j++) {

if (similarityMatrix[j] == tempSimilarity[m] && similarityMatrix[j] != 0.0){

similarity[flag] = tempSimilarity[m];

id[flag]=j;//保存前K个相似度的userid

flag++;

}

System.out.println("相似度最近的" + KNEIGHBOUR + "个用户是：");

System.out.print("近邻用户");

System.out.printf("%25s","相似度");//格式化输出"%25s"是占多少位

System.out.printf("%30sn","推荐产品");

Map<Integer, Double> map = new HashMap<Integer, Double>();//存放每件商品的id和期望值，是键值对关系，即一对一

for (int i = 0; i < KNEIGHBOUR; i++) {//按照k值得大小来循环

// 前k个近邻用户的推荐产品

int user_id = id[i];//数组id中的userid根据相似度大小顺序已经排好，从大到小

int[] items = user_movie_base[user_id];// 获取源数据K个邻近用户userid的所有评分

String str = "";

for (int j = 0; j < COLUMNCOUNT; j++) {//循环每件商品，如果相邻用户对某件商品的评分不为0，而目标用户的评分为0，该商品就为推荐商品

if ((items[j] != 0) && (user_movie_base[userId - 1][j] == 0)){

str += " " + (j + 1);//将推荐商品的id保存在一个字符串中，可以直接输出

//此时，可以通过循环计算某一件推荐商品的评分用户的相似度期望

//开始计算期望，将相同商品的相似度相加，并保存在map集合中

if(map.containsKey(j + 1)){//如果一件商品的值，已经保存在map集合的键中（键是唯一的，即不会和其他的数值一样），那么键对应的值，就会改变，加上该商品不用用户的相似度

double d = map.get(j+1);

d+=similarity[i];

map.put(j+1,d);//修改map中的值

}else{

map.put(j+1, similarity[i]);//如果没有保存一件商品的id，那么开始保存

}

System.out.print(id[i] + 1);

System.out.printf("%16st" ,String.format("%.2f",similarity[i]*100)+"%");//输出的同时格式化数据

System.out.println(str);//输出每个用户的推荐商品

}

//选择最好的推荐商品,期望加权

//循环map集合的键

Map<Integer,Double> map2 = new HashMap<Integer, Double>(); //保存商品id和加权期望,因为还要对加权期望排序，要和商品id对应

double s1 = 0;

double s2 = 0;

Set<Integer> set = map.keySet();//获取map集合中的所有键，输出是一个set集合

for(int key : set){//循环map中的所有键

for (int i = 0; i < KNEIGHBOUR; i++) {

int score = user_movie_base[id[i]][key-1];//map中的键是商品id，i是userid，获取评分

s1+=score*map.get(key);

s2+=score;

}

map2.put(key, s1/s2);//保存加权期望值，和商品id对应

}

Object[] ar

最低0.47元/天解锁文章

weixin_39588432

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分级加权打分算法 java_基于用户的协同过滤推荐算法实现原理及实现代码

基于用户的协同过滤推荐算法实现原理及实现代码基于用户的协同过滤推荐算法实现原理传统的基于用户（User-Based）的协同过滤推荐算法实现原理分四个步骤：1、根据用户历史行为信息构建用户-项目评分矩阵，用户历史行为信息包括项目评分、浏览历史、收藏历史、喜好标签等，本文以单一的项目评分为例，后期介绍其他行为信息和混合行为信息，用户-项目评分矩阵如表1所示：项目1项目2项目3用户A105用户B340用...
复制链接

扫一扫