数据挖掘之【协同过滤算法简版】

最新推荐文章于 2024-01-15 17:00:05 发布

冰火两重天

最新推荐文章于 2024-01-15 17:00:05 发布

阅读量1.7k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sprayabc/article/details/9192469

版权

协同过滤算法在数据挖掘中应用广泛，其核心包括相似性的衡量和推荐项选择。算法分为User-Based和Item-Based两种，前者面临大数据集时效率低下，后者通过计算物品间的相似度进行推荐。本文介绍了相关性系数计算、推荐项的确定，并探讨了Item-Based协同过滤的算法思想。

摘要由CSDN通过智能技术生成

算法简介

协同过滤算法在数据挖掘算法中属于比较简单的，在《集体智慧编程》一书中，开篇讲的就是协同过滤算法。这章早就看完了，没有用代码区实现而已，今天动手敲了代码，返现还是有些感触，特此记录下。

协同过滤的算法核心在于以下两方面：

1）怎么衡量两个向量之间的相似性，此处可以参见我转载的一片博客：数据挖掘之距离计算算法

2）从集合中找出与自己喜好相似度不为零的人中，找出偏好没有出现在我的集合中或打分为0的选项

3）为了避免某些项打分过高产生的影响，采用权重，权重的计算可以由相似度来计算。参见以下代码。

相关性系数计算

#--------------Euclidean distance------------#
def calc_ed_distance(fans,p1_name,p2_name):
    sim = {}
    for k in fans[p1_name].keys():
        if k in fans[p2_name].keys():
            sim[k] = 1
    if l

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冰火两重天

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

SparkML算法详解(关于DataFrame的API操作)--数据挖掘(Scala与Java版)

06-28

#### 协同过滤 - **交替最小二乘ALS**：一种常用的推荐系统算法。 - **显式和隐式反馈**：讨论两种类型的用户反馈数据。 - **冷启动策略**：解决新用户或新项目加入时的问题。 #### 频繁模式挖掘 - **FP-增长(FP-...

一文系统搞懂协同推荐算法（一）

livan1234的博客

02-15

4639

参与评论您还未登录，请先登录后发表或查看评论

采用协同搜索策略的算术优化算法

心升明月的博客

09-16

1433

针对标准算术优化算法（AOA）存在的不足，提出一种新的采用协同搜索策略的算术优化算法(CSSAOA)。首先,采用乘法搜索与除法搜索协同并行搜索的策略来增强算法的全局探索能力；其次,采用减法搜索与加法搜索协同进行的策略来增强算法的局部搜索能力；再次，改进数学优化加速函数(MOA)，使算法在搜索前期侧重进行全局探索，在搜索后期侧重开展局部开发,加快了算法的全局收敛速度；最后，采用外抛交叉变异策略对当前最优个体实施多样性变异，确保在算法搜索前期不至于吸引过多个体过早聚集到群体当前最优个体的周围，增强了算法跳出局部

算法篇--协同过滤

小强签名设计的博客

08-04

1万+

文章目录一、长尾理论二、协同过滤介绍1.基于用户的协同过滤算法（User-based CF，简称UserCF）一、长尾理论 wiki链接：https://wiki.mbalib.com/wiki/%E9%95%BF%E5%B0%BE%E7%90%86%E8%AE%BA 长尾头部的商品往往代表了绝大多数用户的需求而长尾中的商品往往代表了一小部分用户的个性化需求。因此如果要通过发掘长尾来提高销售额就必须充分研究用户的个性化兴趣。而这正是个性化推荐系统主要解决的问题。推荐系统通过发掘用户的行为找到用户

协同过滤算法详解

热门推荐

GFDGFHSDS的博客

03-10

3万+

一、协同过滤算法简介 协同过滤算法是一种较为著名和常用的推荐算法，它基于对用户历史行为数据的挖掘发现用户的喜好偏向，并预测用户可能喜好的产品进行推荐。也就是常见的“猜你喜欢”，和“购买了该商品的人也喜欢”等功能。它的主要实现由： ●根据和你有共同喜好的人给你推荐 ●根据你喜欢的物品给你推荐相似物品 ●根据以上条件综合推荐因此可以得出常用的协同过滤算法分为两种，基于用户的协同过滤算法(user-b...

基于协同的推荐算法

温染的笔记

05-27

894

基于物品的协同算法【核心思想】：给用户推荐那些和他们之前喜欢的物品相似的物品。基于物品的协同算法首先计算物品之间的相似度，计算相似度的方法：基于共同喜欢物品的用户列表计算；基于余弦（Cosine-based）的相似度计算；热门物品的惩罚；基于共同喜欢物品的用户列表计算【计算公式】： wij=∣N(i)⋂N(j)∣∣N(i)∣∗∣N(j)∣ w_{ij} = \frac{|N(i)...

数据挖掘：概念与技术（韩家炜等）中文版

02-28

数据挖掘系统的结构通常包括数据源、数据预处理模块、数据挖掘引擎、模式评估和可视化模块等部分，各模块协同工作，完成从数据获取到知识发现的全过程。 ### 第五章概念描述：特征与比较 #### 5.1 什么是概念描述...

协同过滤推荐算法总结

weixin_33816300的博客

01-25

3537

CRDT协同算法

精选资讯文章

05-29

2684

由于CRDT是处理分布式系统数据同步问题的通用解决方案，所以本文并没有局限于在富文本数据结构的设计，而是从分布式数据同步的角度来理解CRDT，并且穿插着CRDT在富文本领域上的应用，从而让我们能够更好地理解这个数据模型。同样，本文介绍的内容也只是冰山一角，分布式数据的同步一直以来都是个复杂的问题，回归到富文本领域上，如何保证多人协同的编辑器性能、在CAP理论下如何做取舍策略、如何保证数据的稳定性可恢复可回溯、光标的同步处理、如何处理Undo/Redo等等，都是需要深入研究并且设计的。

协同过滤算法代码

liu981975231的博客

05-22

1844

协同过滤算法

爱吃糖的小熊的博客

08-01

5905

文章目录前言原理算法步骤实例python代码前言原理算法步骤实例 python代码

机器学习之协同过滤算法

最新发布

JustinMars的博客

01-15

509

协同编辑中使用的 OT 算法是什么？

fe_watermelon的博客

08-31

2504

大家好，我是前端西瓜哥，今天我们来聊聊 OT 算法是什么。OT 的英文全称是 Operational transformation，是一种处理协同编辑的算法。它常用于实现协同文档的底层算法，支持多个用户同时编辑文档，不会因为并发修改导致冲突，而使结果不一致或数据丢失。...

【推荐算法】协同过滤推荐算法综述 & 传统推荐算法综述

qq_36643449的博客

12-26

3367

常见推荐算法科普

weixin_34123613的博客

06-11

981

2019独角兽企业重金招聘Python工程师标准>>> ...

vonjor

08-31

1万+

协同过滤”可以理解为协同大家的评价、反馈来对巨量的信息进行过滤，并筛选出目标用户可能感兴趣的信息。：给用户推荐和他兴趣相似的其他用户喜欢的产品：给用户推荐和他之前喜欢的物品相似的物品。...

协同过滤算法简单实战

psh111的博客

03-07

872

协同过滤算法 协同过滤算法主要分为两种,一种是基于用户(user)推荐的协同过滤,一种是基于物品(item)的协同过滤,基于user的协同过滤就是找到相似的用户B,然后推荐B用户喜欢的但是当前用户没有喜欢的item给当前用户.基于item的协同过滤就是找到当前用户喜欢的item相似的item,然后把这些item推荐给当前用户. 基于用户的协同过滤 计算用户的相似度计算相似度主要有Jaccard ...

电影推荐系统源码毕业设计：基于Mahout协同过滤