数据挖掘与机器学习
文章平均质量分 87
luyee2010
这个作者很懒,什么都没留下…
展开
-
BloomFilter过滤器过滤算法的简单实现(学习笔记)
BloomFilter主要包括两种操作: add():添加元素到其中 contains():判断一个元素是否在其中,(没有就是没有,说了有但实际上有可能没有) 关于contains()函数: ①,如果结果返回false:则元素一定不再其中 ②,如果返回true,则不一定就在其中,这就是误差 BloomFilter实现(m(byte数组的大小)+k(hash次数)+n(需原创 2013-01-17 02:50:39 · 2878 阅读 · 0 评论 -
Bloom filter 过滤(布隆过滤算法)原理
一,什么是Bloom filter Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见 Bloom filte转载 2013-01-17 02:00:00 · 6500 阅读 · 0 评论 -
深入浅出K-Means算法
纯转来做学习笔记。。 原文地址:http://www.csdn.net/article/2012-07-03/2807073-k-means 摘要:在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。 在数据挖掘中,K-Means算法是一种cluster analysis的算法原创 2013-01-10 17:14:04 · 1612 阅读 · 1 评论 -
搜索 推荐系统 聚类 分类 分类器组合之【智能Web算法】笔记
粗略看了下,还没看完,先贴着目录希望能接着读下去 一,什么是智能Web 二,搜索 用Lucene实现搜索 为什么搜索不仅仅是索引 用链接分析改进搜索结果 PageRank 用户点击初探 三,推荐系统 基于用户相似的推荐 基于条目相似的推荐 基于内容的推荐 四,聚类:事物的分组(与Sql索引比较) 基于分组结构 基于数据结构和类型 基于数据规原创 2013-01-17 22:43:08 · 2404 阅读 · 0 评论 -
Apache Mahout 实现的机器学习算法
Mahout实现的机器学习算法集: 算法大类 算法名称 中文名称 分类算法 Logistic Regression 逻辑回归 Bayesian 贝叶斯 SVM 支持向量机 Perceptron 感知器算法 Neural Network 神经网络 Random Forests原创 2013-01-21 13:53:36 · 2299 阅读 · 0 评论 -
mahout 推荐系统示例
建立java工程,导入需要的jar包 准备好测试的数据:D:\text.txt 1,101,5 1,102,3 1,103,2.5 2,101,2 2,102,2.5 2,103,5 2,104,2 3,101,2.5 3,104,4 3,105,4.5 3,107,5 4,101,5 4,103,3 4,104,4.5 4,106,4 5,101,4原创 2013-01-17 23:41:21 · 7090 阅读 · 2 评论