协同过滤算法:
应用:各个影视app的影视推荐,购物app里面的买了这个物品的人也喜欢…
分类:分为基于用户的协同过滤算法和基于物品的协同过滤算法
本文使用的协同过滤算法为基于用户的协同过滤算法:
杰卡德相似系数(Jaccard similarity coefficient)
其实就是集合的交集除并集
/*
user1:A B C
user2:A B D
user3:B D F
user4:F G H
*/
import lombok.Data;
import java.util.List;
@Data
public class UserM {
private List<String> like;
private double seem;//相似度
}
import java.util.*;
public class Test {
public static void main(String[] args) {
UserM userM1 = new UserM();
UserM userM2 = new UserM();
UserM userM3 = new UserM();
UserM userM4 = new UserM();
List<String> list1 = Arrays.asList("悬疑","恐怖","爱情");
List<String> list2 = Arrays.asList("悬疑","恐怖","战争","爱情","科幻");
List<String> list3 = Arrays.asList("恐怖","战争","伦理","古装","小说");
List<String> list4 = Arrays.asList("战争","伦理","搞笑","小说");
userM1.setLike(list1);
userM2.setLike(list2);
userM3.setLike(list3);
userM4.setLike(list4);
List<UserM> list = new ArrayList<>();
list.add(userM2);
list.add(userM3);
list.add(userM4);
List<UserM> userMS = searchUserM(userM1, list);
for(int i = 0 ; i < userMS.size() ; i++){
userMS.get(i).setSeem(compare(userM1,userMS.get(i)));
System.out.println(userMS.get(i).toString());
}
Map<String, Double> recommend = recommend(userM1, userMS);
System.out.println(recommend);
}
/**
*
* @param userM1 当前登录用户
* @param userM2 要进行相似度比较的用户
* @return 相似度
* //比较两个集合,相同的即放在union,又放在intersection
* //不同的,放在union
* //用杰卡德相似系数求相似度--杰卡德系数 = 交集/并集
*/
public static double compare(UserM userM1,UserM userM2){
//并集
List<String> union = new ArrayList<>();
//交集
List<String> intersection = new ArrayList<>();
List<String> like1 = userM1.getLike();
List<String> like2 = userM2.getLike();
//将userM1的like先放入并集
for(int i = 0 ; i < like1.size() ; i++){
union.add(like1.get(i));
}
//将like2与并集进行对比
for(int i = 0 ; i < like2.size() ; i++){
if(union.contains(like2.get(i))){
//如果并集中存在,加入到交集中
intersection.add(like2.get(i));
}else{
//并集中不存在,加到并集中
union.add(like2.get(i));
}
}
//相似度
double likes = (double)intersection.size()/union.size();
return likes;
}
/**
*
* @param userM 当前用户
* @param list 与当前用户相关的用户
* @return 对当前用户的电影的推荐度
*/
public static Map<String,Double> recommend(UserM userM,List<UserM> list){
List<String> recommends = new ArrayList<>();
Map<String,Double> map = new HashMap<>();
for(int i = 0 ; i < list.get(0).getLike().size() ; i++){
recommends.add(list.get(0).getLike().get(i));
map.put(list.get(0).getLike().get(i),list.get(0).getSeem());
}
for(int j = 1 ; j < list.size() ; j++){
for(int i = 0 ; i < list.get(j).getLike().size() ; i++){
//如果recommends里面存在,即有交集
if(recommends.contains(list.get(j).getLike().get(i))){
//如果有,修改值
map.replace(list.get(j).getLike().get(i),map.get(list.get(j).getLike().get(i))+list.get(j).getSeem());
}else{
//recommends中不存在
map.put(list.get(j).getLike().get(i),list.get(j).getSeem());
}
}
}
return map;
}
/**
*
* @param userM 当前登录用户
* @param list 全部用户
* @return 与当前登录用户相关的用户
*/
public static List<UserM> searchUserM(UserM userM,List<UserM> list){
List<String> like = new ArrayList<>();//存放当前登录用户喜欢的类型
List<UserM> listU = new ArrayList<>();//存放与当前登录用户相关的用户
for(int i = 0 ; i < userM.getLike().size() ; i++){
like.add(userM.getLike().get(i));
}
for(int i = 0 ; i < list.size() ; i++){
for(int j = 0 ; j < list.get(i).getLike().size() ; j++){
if(like.contains(list.get(i).getLike().get(j))){
listU.add(list.get(i));
break;
}else{
continue;
}
}
}
return listU;
}
}
结果