数据挖掘
文章平均质量分 78
sunByFeng
这个作者很懒,什么都没留下…
展开
-
数据挖掘的概念
数据挖掘基本功能主要体现在分类与回归、聚类分析、关联规则、时序模式、异常检测等5个方面。分类与回归:分类是“有监督的学习”。分类过程由两步构成,模型创建和模型使用。模型创建是指对训练数据集的学习来建立分类模型;模型使用是指使用分类模型对测试数据和新的数据进行分类。通常分类模型以分类规则、决策树或数学表达式给出。聚类分析:“无监督的学习”。聚类是将数据划分或者分割成2相交或者不想交的群组的过程。通原创 2017-11-27 20:23:44 · 933 阅读 · 2 评论 -
推荐算法简述
1. 推荐系统定义 组成部分:系统用户,推荐对象,推荐算法。 推荐流程:首先建立用户模型,根据推荐对象的信息建立对象模型,最后根据推荐策略、用户信息、对象信息进行个性化推荐。 一般形式化定义:用户集合U,资源C。有效函数f描述资源c对用户u的推荐度。 f: .R表示用户的评分。 2. 主流推荐算法 基于内容;协同过滤,基于知识推荐和混合推荐。基于内容推荐算法 不需要用户对资原创 2017-05-18 16:21:17 · 936 阅读 · 0 评论 -
基于矩阵分解的推荐算法(java代码实现)
目前推荐系统中用的最多的就是矩阵分解方法,在Netflix Prize推荐系统大赛中取得突出效果。以用户-项目评分矩阵为例,矩阵分解就是预测出评分矩阵中的缺失值,然后根据预测值以某种方式向用户推荐。常见的矩阵分解方法有基本矩阵分解(basic MF),正则化矩阵分解)(Regularized MF),基于概率的矩阵分解(PMF)等。今天以“用户-项目评分矩阵R(N×M)”说明三种分解方式的原理以及应原创 2017-05-16 10:40:19 · 8255 阅读 · 3 评论