自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (4)
  • 收藏
  • 关注

转载 mahout目前支持的算法汇总

在Mahout实现的机器学习算法见下表:算法类算法名中文名分类算法Logistic Regression逻辑回归Bayesian贝叶斯SVM支持向量机Perceptron感知器算法Neural N

2014-02-27 17:38:51 1811

转载 mahout聚类

聚类分析什么是聚类分析?聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。

2014-02-27 17:03:10 2602 1

转载 mahout相似度算法(二)

在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用于实现相似度计算的组件之间的关系:图1、项目相似度计算组件图2、用户相似度计算组件

2014-02-27 12:20:10 1055

转载 mahout相似度算法(一)

User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍:1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity皮尔森相关系数反应了两个变量之间的线性相关程度,它的取

2014-02-27 12:16:26 1266

转载 mahout推荐CF

协同过滤 —— Collaborative Filtering协同过滤简单来说就是根据目标用户的行为特征,为他发现一个兴趣相投、拥有共同经验的群体,然后根据群体的喜好来为目标用户过滤可能感兴趣的内容。协同过滤推荐 —— Collaborative Filtering Recommend协同过滤推荐是基于一组喜好相同的用户进行推荐。它是基于这样的一种假设:为一用户找到他真正感兴趣的内

2014-02-27 11:42:10 751

转载 mahout数据源

推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。Pr

2014-02-27 11:38:42 1908

转载 hadoop系列文章

http://www.cnblogs.com/xia520pi/archive/2012/04/08/2437875.html

2014-02-26 16:21:34 610

转载 MAT内存泄露分析

几个还不错的例子,学会了如何定位java的内存泄露问题,如下:例1、http://tivan.iteye.com/blog/1487855例2、http://blog.csdn.net/knowledgeaaa/article/details/16903241http://blog.csdn.net/knowledgeaaa/article/details/169033

2014-02-19 15:40:51 758

转载 java工具

Java 内存泄露监控工具(一) -- JVM监控工具介绍jstack, jconsole, jinfo, jmap, jdb, jstatjstack -- 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属

2014-02-19 10:48:05 1966

转载 jstack线程说明

现在市面上很少有人对这一块做整理,所以,导致很多新人在拿到一个stack文件之后,也是一头雾水。线程名称 所属 解释说明Attach ListenerJVMAttach Listener 线程是负责接收到外部的命令,而对该命令进行执行的并且吧结果返回给发送者。通常我们会用一些命令去要求jvm给我们一些反

2014-02-17 10:21:12 916

转载 jvisualvm相关

由于在建项目的需要,监控tomcat的内存使用,检查内存泄漏的情况。其实JDK自身已经提供了很多工具,都在JAVA_HOME/bin/目录下:jvisualvm、jconsole、jstatd、jmap等等,以下为试验的环境配置: client: vista、jdk1.6.0_18server: linux、jdk1.6.0_02、tomcat6、IP:192.168.8.7主要从下面

2014-02-17 09:56:26 850

Subversive-2.0.4.I20150123-1700.zip

eclipse插件Subversive-2.0.4.I20150123-1700.zip

2015-03-03

推荐系统实践

推荐 实践 算法 中文 实例 文档 文章真心不错啊

2014-02-21

css+div支持技术

详细的CSS+DIV技术支持文档!网页美工学习者必看。

2009-05-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除