hadoop
野孩子1991
热爱所以不放弃
展开
-
hadoop1.2.1在linux中配置安装独立运行Standalone Operation,伪分布Pseudo-Distributed Operation,集群配置三种配置和测试
1:安装sun jdk 我此处用的另一篇文章中的命令,但是安装的貌似是OPenJDK,老师要求不能安装这个一定要是sunjdk,否则后面会后问题,我决定后面有问题时我再改。而且此处我安装后并没有专门的配置环境变量后面的步骤中会有。 2:安装ssh(hadoop使用 ssh 来实现 cluster 中各 node 的登录认证,即Namenode是通过SSH来启动和停止各个datanode上的各种守护进程的,所以一定要实现免密码登录,免密码 ssh 设置在后文中有介绍) sudo apt原创 2015-10-16 17:22:22 · 1525 阅读 · 0 评论 -
hive笔记
[TOC] 架构在Hadoop之上,提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 hive是一个数据仓库工具,作用是可以将结构化的数据文件映射为一张数据库表,并提供简单查询功能,可以将sql语句转化为Mapreduce任务进行,是在Hadoop上的数据库基础架构。 Hive 不是一个关系数据库/实时查询和行级更新的语言.Hadoop是一个开源框架来存储和处理原创 2018-04-24 17:26:55 · 466 阅读 · 0 评论