探索 Pexpect,第 1 部分:剖析 Pexpect

From: http://www.ibm.com/developerworks/cn/linux/l-cn-pexpect1/index.html   探索 Pexpect,第 1 部分:剖析 Pexpect   吕 学良 (lvxuel@cn.ibm.com)...

2011-04-15 11:22:10

阅读数 24

评论数 0

HDFS 抛出错误 (java.io.IOException: config())

  DEBUG [main] Configuration.<init>(211) | java.io.IOException: config() at org.apache.hadoop.conf.Configuration.&lt...

2011-04-07 14:56:45

阅读数 29

评论数 0

HBase vs Cassandra: 我们迁移系统的原因

HBase vs Cassandra: 我们迁移系统的原因 原文: http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/原作者:Dominic Williams原文发布日期:Februa...

2011-04-01 14:52:10

阅读数 25

评论数 0

hbase 介绍

hbase 介绍 一、简介 history  started by chad walters and jim 2006.11 G release paper on BigTable 2007.2 inital HBase prototype created as Hadoop c...

2011-04-01 14:51:25

阅读数 28

评论数 0

HBase技术介绍

From:http://www.searchtb.com/2011/01/understanding-hbase.html HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server...

2011-04-01 14:49:18

阅读数 26

评论数 0

HBase与BigTable的比较(翻译)

知,HBase是Google的BigTable架构的一个开源实现。但是我个人觉得,要做到充分了解下面两点还是有点困难的:一 HBase涵盖了BigTable规范的哪些部分?二 HBase与BigTable仍然有哪些区别?下面我将对这两个系统做些比较。在做比较之前,我要指出一个事实:HB...

2011-04-01 13:41:46

阅读数 27

评论数 0

Cassandra Vs HBase

Cassandra vs HBaseBy Vaibhav Puranik Translated By Jametong我们是一家广告网络公司.我们需要存储展示与点击信息.我们在为我们的新项目评估多个不同的大批量数据(或nosql,或任何你喜欢的称呼)系统.过去8个月中,我们一直在一个测试产品上使用...

2011-03-31 17:27:33

阅读数 21

评论数 0

Slope one:简单高效的推荐算法

推荐系统最早在亚马逊的网站上应用,根据以往用户的购买行为,推荐出购买某种产品同时可能购买的其他产品,国内做的不错的当当网,有时候买书,它总能给我推荐出我感兴趣的其他书来,也算是技术极大的促进了销售。 一般的协同过滤算法,首先是收集用户对事物(产品)的评分情况,一种直接对某本书,或者某个歌曲打...

2011-03-31 17:16:33

阅读数 17

评论数 0

Hadoop 状态分析系统Chukwa

http://hi.baidu.com/ops_bd/blog/item/5f39abde48a10f3f10df9b12.html     Apache 的开源项目 hadoop, 作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于 hadoop 的应用和相关扩展...

2011-03-31 16:50:15

阅读数 25

评论数 0

Hadoop安装, Hive 安装。

  Hadoop安装指南 / Hive安装指南   Hadoop集群需要一个机器作为Master节点,其余的机器都是slave节点。 HIVE只需在Master节点中安装和配置即可。   配置Hadoop Hadoop的配置比较简单,下面详细讲一下安装与配置步骤。 以配置H...

2011-03-30 17:48:44

阅读数 19

评论数 0

Hive 的扩展特性

Hive 的扩展特性 文章分类:Java编程 Hive 是一个很开放的系统,很多内容都支持用户定制,包括: 文件格式:Text File,Sequence File 内存中的数据格式: Java Integer/String, Hadoop IntWritable/Te...

2011-03-30 15:54:50

阅读数 21

评论数 0

HIVE中map,array和structs使用

1:怎样导入文本文件(格式是怎样的?),2:怎样查询数据,已经能否在join中使用?在子查询中使用?等等知道怎么在hive中导入数组不?例如:我想把 数组[1,2,3] 和 数组 ["a","b","...

2011-03-30 15:25:11

阅读数 38

评论数 0

Hive 中UDF和UDAF简述

  From: http://blog.csdn.net/dajuezhao/archive/2010/07/21/5753001.aspx 一、UDF 1、背景:Hive是基于Hadoop中的MapReduce,提供HQL查询的数据仓库。Hive是一个很开放的系统,很多内容都支持...

2011-03-30 15:24:10

阅读数 17

评论数 0

Hive 中 SerDe 概述

From: http://blog.csdn.net/dajuezhao/archive/2010/07/21/5753791.aspx 一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。发送方需要把对象转化为字节...

2011-03-30 15:17:57

阅读数 35

评论数 0

做事遵循一个好的习惯

     Habit 1:积极主动   Habit 2:以终为始   Habit 3:重者先行   Habit 4:互惠互利   Habit 5:知彼知己   Habit 6:团结协作   Habit 7:坚持不懈

2011-03-29 13:25:54

阅读数 17

评论数 0

Hive 与 Hbase 的简单区别

Hive是為簡化編寫MapReduce程序而生的,使用MapReduce做過數據分析的人都知道,很多分析程序除業務邏輯不同外,程序流程基本一樣。在這種情況下,就需要Hive這樣的用戶編程接口。Hive本身不存儲和計算數據,它完全依賴於HDFS和MapReduce,Hive中的表純邏輯表,就是些表的...

2011-03-28 11:10:49

阅读数 18

评论数 0

通过Thrift 方式访问 Hive

  package com.netqin.hive.kpi; import org.apache.hadoop.hive.service.HiveClient; import org.apache.hadoop.hive.service.HiveServerException; imp...

2011-03-21 14:09:35

阅读数 42

评论数 0

Hive 安装手册

  安装Hive 安装Hive是非常简单的,前提是你已经在你的机器上安装好了Java 1.6   Hive 可以从 http://hive.apache.org/releases.html 下载到,最新版为0.6.0(2010-10-19)   Hive的目录结构为   ...

2011-03-21 14:04:02

阅读数 40

评论数 0

Hive 日志

Hive日志存储在什么地方呢?   打开Hive安装目录的 conf /hive-log4j.properties 文件。   hive.log.dir=/tmp/${user.name} hive.log.file=hive.log   这两行就表示了你的Hive中日志的...

2011-03-17 17:44:12

阅读数 45

评论数 0

The Google File System中文版

    Google MapReduce中文版        译者:alex   http://blademaster.ixiezi.com/2010/03/27/google-mapreduce%e4%b8%ad%e6%96%87%e7%89%88/   The Google Fil...

2010-10-09 20:34:20

阅读数 19

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭