机器学习与数据挖掘
liang_wen_bo
这个作者很懒,什么都没留下…
展开
-
UFLDL教程
UFLDL教程说明:本教程将阐述无监督特征学习和深度学习的主要观点。通过学习,你也将实现多个功能学习/深度学习算法,能看到它们为你工作,并学习如何应用/适应这些想法到新问题上。本教程假定机器学习的基本知识(特别是熟悉的监督学习,逻辑回归,梯度下降的想法),如果你不熟悉这些想法,我们建议你去这里机器学习课程,并先完成第II,III,IV章(到逻辑回归)。转载 2013-04-10 10:19:38 · 4068 阅读 · 0 评论 -
局部敏感哈希LSH
(转)局部敏感哈希LSH网上转的关于LSH(局部敏感哈希)的介绍 一、原始LSH1、概述 LSH主要用来解决高维空间中点的近似最近邻搜索问题,即Approximate Nearest Neighbor。LSH将原始空间中的点嵌入到Hamming空间中,即原始空间中点的表达形式转换成Hamming空间中点的表达形式,原始空间中的距离度量转换成Hamming空转载 2013-05-02 09:58:10 · 1739 阅读 · 0 评论 -
聚类算法
聚类算法算法methods数据挖掘数据库网格工具目录(?)[+]聚类聚类算法分类K-MEANS算法K-MEDOIDS算法Clara算法Clarans算法转自:http://baike.baidu.com/view/69222.htm聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量转载 2013-05-07 11:59:09 · 2044 阅读 · 0 评论 -
LSH之2
互联网用户每天会访问很多的网页,假设两个用户访问过相同的网页,说明两个用户相似,相同的网页越多,用户相似度越高,这就是典型的CF中的user-based推荐算法。算法的原理很简单,只要两两计算用户的相似性,针对每个用户,获取最相似的K个用户即可。但是在实际的工程上,假定用户规模在亿的规模N,计算复杂度为N*N,即使是分布式,也是非常可怕的复杂度。考虑一下,我们是不是转载 2013-05-07 11:31:41 · 711 阅读 · 0 评论