萧然

大数据,机器学习,推荐系统,数据挖掘,hadoop,mahout,spark

mahout做推荐时uid,pid为string类型

在某些网站中,存储的数据可能不是

2014-08-20 11:34:16

阅读数 2008

评论数 2

隐马尔可夫模型(HMM)攻略

隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时...

2014-07-17 16:49:40

阅读数 1160

评论数 0

hadoop SequenceFileOutputFormat与LzopCodec压缩问题

用mahout库做推荐系统,吗

2014-07-15 09:53:37

阅读数 907

评论数 0

maven项目test编写

在maven项目中,可以在编译时对一些模块做测试。

2014-07-01 14:54:56

阅读数 1985

评论数 0

java连接mongodb

直接上代码 java.util.List mongoHostList = new ArrayList(); mongoHostList.add(new ServerAddress("192.168.1.102",27017)); Mongo mg = new Mo...

2014-07-01 14:39:11

阅读数 569

评论数 0

hdfs合并结果和hdfs内部拷贝

问题:当一个mapreduce程序的输入是很多个mapreduce的输出时,由于input

2014-07-01 14:35:17

阅读数 4624

评论数 0

maven项目用filter管理不同环境的配置文件

在很多互联网项目中,测试环境和线上环境都是分离的

2014-07-01 14:19:14

阅读数 2024

评论数 0

线性回归系列(4)-线性回归及梯度下降

本文会讲到: (1)线性回归的定义 (2)单变量线性回归 (3)cost function:评价线性回归是否拟合训练集的方法 (4)梯度下降:解决线性回归的方法之一 (5)feature scaling:加快梯度下降执行速度的方法 (6)多变量线性回归 Linear ...

2014-06-18 15:47:59

阅读数 808

评论数 0

线性回归系列(3)-多元线性回归

多元回归分析,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

2014-06-18 15:39:46

阅读数 1236

评论数 0

线性回归系列(2)-一元线性回归

一元线性回归,顾名思义,即只有一个变量的回归方程。

2014-06-18 15:23:16

阅读数 555

评论数 0

线性回归系列(1)-最小二乘法

1.

2014-06-18 11:02:11

阅读数 966

评论数 0

scala编程系列(14)-实现分数相加的类(下)

继续上篇 9.方法重载

2014-06-13 18:27:39

阅读数 707

评论数 0

scala编程系列(13)-实现分数相加的类(中)

接上篇 6.辅助构造器

2014-06-13 18:03:14

阅读数 802

评论数 0

scala编程系列(12)-实现分数相加的类(上)

在scala编程中有这么一章,专门讲有理数的相加,即Rational

2014-06-13 17:14:26

阅读数 1151

评论数 0

mahout中的相似度

1.PearsonCorrelationSimilarity皮尔逊距离 皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。

2014-06-10 15:28:27

阅读数 853

评论数 0

SVD奇异值分解(3)-推荐算法应用

SVD当前在推荐系统中运用很多,在mahout中就有其实现。

2014-06-10 14:49:00

阅读数 1079

评论数 0

SVD奇异值分解(2)-详解

在上一节中知道 特征值分解使用条件有限,仅适用于方阵,且要求是实对称矩阵。 试想:如果需要分析的矩阵不是方阵(事实经常如此),该怎样处理呢?这就是奇异值分解

2014-06-10 14:42:42

阅读数 782

评论数 0

SVD奇异值分解(1)-数学基础

1. 奇异值分解(SingularValue Decomposition)是线性代数中一种重要的矩阵分解,是矩阵分析中正规矩阵酉对角化的推广。

2014-06-10 14:33:19

阅读数 1234

评论数 0

scala编程系列(11)-scala富包装器

scala富包装器其实就是一些基本操作

2014-06-05 17:06:17

阅读数 827

评论数 0

scala编程系列(10)-scala字面量

首先解释下字面量(literal),字面量就是在用户不指定变 在scala变量类型中都可以写

2014-06-05 16:53:00

阅读数 1747

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭