数据挖掘
文章平均质量分 95
Freelancefangjian
努力中
展开
-
数据挖掘--分类器
数据挖掘在实践中的应用使用随机森林首先应该从数据中提炼训练集Train和测试集Test两部分。训练集和测试集是不能有交集的,即。训练集和测试集中的数据是从原始数据中提炼出来的。训练集和测试集的维度必须相等。主要是因为随机森林是分类问题。分类问题,就是将测试集中数据一个一个的扔进分类器,分类器给出一个结果,作为输出,这个输出的数就是分类的类别。那么分类器是怎么运作的呢?分类器是,对测试集中的属性...原创 2017-12-08 20:11:02 · 989 阅读 · 0 评论 -
基于图像的流行排序算法
基于图的排序问题描述如下: 给定一个节点作为查询,剩下的节点根据它们对给定查询的相关性排序。 目标是学习一个排序函数,该函数定义了未标记的节点和查询之间的相关性。 1、流行排序算法 在[39]中,提出了一种利用数据(如图像)的内在流形结构进行图形标注的排序方法。给定一个数据集X={x(1),…,x(i),x(i+1),…,x(n)},一些数据点被标记为查询,其余的则需要根据它们与查询的关系进行翻译 2017-12-20 19:17:54 · 6303 阅读 · 3 评论