![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
小雨滴滴滴的童鞋
这个作者很懒,什么都没留下…
展开
-
数据挖掘学习笔记-入门基础篇
1、什么是数据挖掘数据挖掘时在大型数据存储库中,自动的发现有用信息的过程。数据挖掘技术用来探查大型大数据,发现先前位置的有用模式。2、KDD -konwledge discovery in database 数据挖掘时KDD中不可或缺的一部分3、数据挖掘任务预测任务:这些任务的目标是根据其他属性的值,预测特定属性的值。被预测的属性一般称为目标自变量或因变量,而用来做预测原创 2016-07-07 11:49:33 · 802 阅读 · 0 评论 -
数据挖掘学习笔记-数据篇
1、数据的预处理聚集(aggregation):将两个或多个对象合并成单个对象 优势:1、数据规约导致较小的数据集需要较小的内存和处理时间,因此可以使用开销更大的数据挖掘算法 2、高层的数据视图较于低级的视图原创 2016-07-07 15:32:07 · 806 阅读 · 0 评论 -
NDCG评价指标讲解
Normalized Discounted Cumulative Gain,即NDCG,常用于作为对rank的评价指标,当我们通过模型得出某些元素的ranking的时候,便可以通过NDCG来测评这个rank的准确度,同样的算法还包括MAP,MRR等,这里只讲解NDCG。我们通过一个实例来说明一下这个NDCG的用法id12345模型评分原创 2016-09-26 14:21:54 · 15447 阅读 · 0 评论 -
可调参的K-means算法
选自:《Unifying Dependent Clustering and Disparate Clustering for Non-homogeneous Data 》传统的K-means的算法如下:这个表示的是聚类的簇,i代表的的是不同的类,i'代表的是类外的点,i是类内的点。这个公式是代表的类内的点到类外的点的距离肯定小。有公式可以看得出,整个公式是一个类似的阶跃函数,很明显原创 2016-12-04 14:52:06 · 583 阅读 · 0 评论