推荐系统中的数据挖掘方法---《推荐系统技术、评估及高效算法》---读书笔记（2）

最新推荐文章于 2021-01-29 03:57:29 发布

HGaviN

最新推荐文章于 2021-01-29 03:57:29 发布

阅读量1k

点赞数

分类专栏：推荐系统机器学习及应用文章标签：推荐系统数据挖掘读书笔记简介

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LieQueov/article/details/79590682

版权

机器学习及应用同时被 2 个专栏收录

40 篇文章 5 订阅

订阅专栏

11 篇文章 4 订阅

订阅专栏

一、目录组织图（点击图放大）

二、补充笔记

1、在社交网络环境下，余弦相似度效果最好。但，在一般案例中，推荐系统预测的精确性不受相似度度量方法选择的影响。

2、交叉验证需要大数据集，否则结果不可信。

3、分类器评估可以考虑以下指标：真正(TP):分类到A且真的属于A的实例数量，真负(TN)：没有分类到A且真的不属于A的实例数量，假正(FP)：分类到A但不属于A的实例数量，假负(FN):没有分类到A但属于A的实例数量。从而可以定义准确率和召回率。

准确率：

$$P=\frac{TP}{(TP+FP)}$$

召回率：

$$R=\frac{TP}{(TP+FN)}$$

但是单独使用这两个指标会产生误导，结合预测和召回率到单一指标为：

$$\frac{2TP}{(2TP+FN+FP)}$$

4、关联规则挖掘

关联规则：

$$ X\Rightarrow Y $$

支持度表示同时拥有X和Y事务的比例，置信度表示Y中的物品有多经常出现在X的事务中。关联规则的目标发现具有支持度大于等于支持度阈值以及置信度大于等于置信度阈值的所有规则。采取的方法为（1）产生所有支持度大于等于支持度阈值的物品集（频繁物品集生成）；（2）从每一频繁物品集中产生高置信的规则（规则生成）。

5、在推荐系统中，选择合适的挖掘技术本身就是一个难点。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。