![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Haddop
文章平均质量分 65
woshichengchaoa
这个作者很懒,什么都没留下…
展开
-
HDFS简介
1、HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。它所具有的高容错、高可靠性、高可扩展性、高获得性、高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Large Data Set)的应用处理带来转载 2013-12-31 10:52:07 · 630 阅读 · 0 评论 -
数据导入HBase最常用的三种方式及实践分析
http://www.csdn.net/article/2014-01-07/2818046转载 2014-01-14 09:36:17 · 452 阅读 · 0 评论 -
Hive 内建操作符与函数开发——深入浅出学Hive
初始HiveHive安装与配置Hive 内建操作符与函数开发Hive JDBChive参数Hive 高级编程Hive QLHive Shell 基本操作hive 优化Hive体系结构Hive的原理 第一部分:关系运算 Hive支持的关系运算符 •常见的关系运算符 •等值比较: = •不等值比较: •转载 2014-01-22 17:33:22 · 797 阅读 · 0 评论 -
腾讯大规模Hadoop集群实践
摘要:TDW是腾讯最大的离线数据处理平台。本文主要从需求、挑战、方案和未来计划等方面,介绍了TDW在建设单个大规模集群中采取的JobTracker分散化和NameNode高可用两个优化方案。TDW(Tencent distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据转载 2014-02-20 09:57:07 · 799 阅读 · 0 评论 -
Hadoop-1.2.1的eclipse插件编译
大致流程如链接:http://www.cnblogs.com/alex-blog/p/3160619.html转载 2014-05-26 19:06:59 · 555 阅读 · 0 评论 -
hadoop datanode无法启动
启动hadoop发现datanode总是无法启动原创 2014-05-27 15:09:27 · 517 阅读 · 0 评论 -
linux下hadoop伪分布配置
1.下载,http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 选择1.2.1版本。版本务必选择原创 2014-05-20 16:15:55 · 823 阅读 · 0 评论 -
Hadoop在eclipse上实践之一——WordCount
1、新建一个Map-Reducee原创 2014-05-27 12:27:39 · 416 阅读 · 0 评论 -
Hadoop I/O操作(笔记)
8.1 I/O操作中的数据检查1.对本地I/O的检查原创 2014-06-30 18:28:47 · 902 阅读 · 0 评论