数据挖掘
雷伊_2013
这个作者很懒,什么都没留下…
展开
-
C4.5算法(转)
C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射关系,并且这个映射能用于对新的类别未知的实体进行分类。 C4.5由J.Ross Quinlan在ID3的基础上提出的。ID3算法用来构造决策树。决策树是一种类转载 2013-05-18 16:28:52 · 958 阅读 · 0 评论 -
数据挖掘中易犯的几大错误(转)
文章转自 丕子原文来自:http://database.ctocio.com.cn/200/12153200.shtml===按照Elder博士的总结,这几大易犯错误包括:缺乏数据(Lack Data)太关注训练(Focus on Training)只依赖一项技术(Rely on One Technique)提错了问题(Ask t转载 2013-07-22 19:48:17 · 801 阅读 · 0 评论 -
机器学习相关——协同过滤
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么转载 2013-10-11 14:30:15 · 690 阅读 · 0 评论 -
推荐系统的常用算法概述
推荐系统的常用算法概述 前一阵子准备毕业论文的开题,一直在看推荐系统相关的论文。对推荐系统有了一个更加清晰和理性的认识,也对推荐算法有了深入了解。借此机会总结分享一下,大家多多拍砖。推荐系统的出现 随着互联网的发展,人们正处于一个信息爆炸的时代。相比于过去的信息匮乏,面对现阶段海量的信息数据,对信息的筛选和过滤成为了衡量一个系统好坏的重要指标。一个具有良好用户体验的转载 2013-10-11 14:32:00 · 1162 阅读 · 0 评论 -
k-d tree算法【转】
k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。应用背景 SIFT算法中做特征点匹配的时候就会利用到k-d树。而特征点匹配实际上就是一个通过距离函数在高维矢量之间进行相似性检索的问题。针对如何快速而准确地找到查询点的近邻,现在提出了很多高维空间索引结构和近似查询的算法,k-d树就是其中一种。转载 2013-11-04 15:15:31 · 750 阅读 · 0 评论